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Etiquetas y símbolos usados en el tesauro 


A continuación, se muestran las etiguetas y símbolos utilizados para las no- 
tas, notación y relaciones. Están basados en la norma ISO 25975-1:2005, 
pero debe tenerse en cuenta que las recomendaciones de la norma para el 
español no están completas, por lo que hemos agregado de nuestra parte las 
etiquetas NH, TGE y TEE. 
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mutipalabra 
UP+ £l térmmno oue sigue es un térmmno compuesto no preferente 
Tr Término tope 
< To Término genérico 
T16G Término genérico genénco 
< 16P Término genérico parttivo 
TGE Término genénco enumeratreo 
> n Término especiio 
TEG Término especihco genérico 
>- To Término especiheo partiro 
TEE Término especihco enumeratro 
mr Término relacionado 
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AENOR: Asociación Española de Normalización y Certificación 
ANSTI: American National Standard Institute 

ARMARC: Archivo de Autoridades de Materia en Formato MARC 
ASC: Afrika Studiecentrum 

ASTIA: Armed Services Technical Information Abstracts 

BC: Bibliographic classification 

BMD: Bureau Marcel van Dijk 

BNF: Bibliotheque Nationale de France 

BS: British standard [norma británica] 

BSI: British Standards Institute 
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CDU: Clasificación decimal universal 

COSATT: Committee on Scientific and Technical Information 
CRG: Classification Research Group 

DCMI: Dublin Core Metadata Initiative 

DeCS: Descriptores en Ciencias de la Salud 

DOI: Digital Object Identifier 

FRAD: Requisitos funcionales para datos de autoridad 

FRBR: Requisitos funcionales para registros bibliográficos 
FRSAD: Requisitos funcionales para datos de autoridad de materia 
ICONTEC: Instituto Colombiano de Normas Técnicas y Certificación 
IFLA: International Federation of Library Associations and Institutions 
IRAM: Instituto Argentino de Normalización 
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ISO: International Organization for Standardization 

ISSN: International Standard Serial Number 

TUBMB: International Union of Biochemistry and Molecular Biology 
TUPAC: International Union of Pure and Applied Chemistry 

IZ: Thesaurus Socialwissenschaften 

KB: Koninklijke Bibliotheek 

KWAC: Keyword and context (palabra clave y contexto) 

KWIC: Keyword in context (palabra clave en el contexto) 

KWOC: Keyword out of context (palabra clave fuera de contexto) 
LCC: Library of Congress classification 

LCSH: Library of Congress subject headings 

LEMB: Lista de encabezamientos de materia para bibliotecas 
MADS: Metadata authority description schema 

MARC Machine Readable Cataloging 

MesSH: Medical subject headings 

NISO: National Information Standards Organization 

OAI-PMH: Open Archives Initiative Protocol Metadata Harvesting 
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SAR: Sistema de almacenamiento y recuperación 

SCDD: Sistema de clasificación decimal de Dewey 

Sears: Lista de encabezamientos de materia para bibliotecas pequeñas de 
Sears 

SKOS: Simple knowledge organization system (Sistemas simples de organi- 
zación del conocimiento) 

SOC: Sistema de organización del conocimiento 

SWD: Schlagwortnormdatei 

TEE: Tesauro europeo de educación 

UAT: Unified astronomy thesaurus 

UML: Unified modelling language 


UNBIS: United Nations Bibliographic Information System 

UNESCO: Organización de las Naciones Unidas para la Educación, la Cien- 
cia y la Cultura 

URI: Uniform resource identifier 

W3C: World Wide Web Consortium 

Web: World Wide Web 

WWW: World Wide Web 

XML: Extensible markup language 


Prefacio 


La presente obra, de carácter introductorio, está dirigida a estudiantes y 
profesionales de bibliotecología, documentación o ciencia de la información 
de lengua española que se enfrentan por primera vez al tema del diseño y 
desarrollo de tesauros. 

Una objeción que puede hacerse a este texto es que ya se han publicado 
otros escritos de reconocidos autores sobre este tema. También existen di- 
versas normas de organismos normalizadores y especializados en esta área, 
particularmente la International Organization for Standardization (ISO) y la 
International Federation of Library Associations and Institutions (IFLA). Va- 
rios de estos manuales y de estas normas se citan aquí y nos reconocemos en 
deuda con todos ellos. 

Sin embargo, como afirma un viejo refrán, “cada maestrito con su libri- 
to”. Nos importa encuadrar el diseño y desarrollo de tesauros dentro del mar- 
co referencial de la organización del conocimiento, entendida en su relación 
con la bibliotecología, la documentación y la ciencia de la información, tal 
como ha sido recomendado por el IV Encuentro de Directores de Escuelas 
de Bibliotecología y III Encuentro de Docentes de Bibliotecología del Mer- 
cosur, celebrado en Montevideo en 2000. Este marco referencial nos obliga a 
considerar el tesauro como un sistema de organización del conocimiento y a 
usar una terminología acorde. 

Por otra parte, y a diferencia de los textos citados en esta obra, reco- 
gemos el aporte de las nuevas normas de diseño y desarrollo de tesauros 
publicadas en este siglo veintiuno, especialmente la norma internacional ISO 
25964-1/2, que ha puesto el énfasis en la publicación electrónica del tesauro y 
en el aprovechamiento de los recursos informáticos para la interoperabilidad 
entre los tesauros y otros sistemas de organización del conocimiento. 

Por supuesto, también nos interesa reflejar nuestros puntos de vista, así 
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como las coincidencias y las diferencias con otros autores. Nada de esto va 
en detrimento de las distintas ideas o posiciones. 

En los capítulos 1 y 2 hacemos una introducción a la organización del co- 
nocimiento, así como a sus sistemas y procesos. En el capítulo 3 se analizan 
distintos enfoques con los que se han estudiado los sistemas de organización 
del conocimiento. Estos tres capítulos constituyen el marco de referencia en 
el que insertamos el tesauro y su diseño y desarrollo. 

Adentrándonos en el tema específico de esta obra, en los capítulos 4 y 5 
ofrecemos una definición de tesauro y su caracterización, así como una breve 
reseña de su origen y su razón de ser. 

En el capítulo 6 presentamos el diseño y desarrollo de tesauros como 
una Cadena de procesos de organización del conocimiento, basándonos en 
conocidas técnicas de gestión. Un apartado especial en este capítulo está de- 
dicado al principio de garantía en el que deben basarse todas las decisiones 
del diseño y desarrollo de un tesauro. 

En el capítulo 7 se profundiza sobre el vocabulario del tesauro, sus for- 
mas gramaticales, la desambiguación y la relación de equivalencia. A con- 
tinuación, en el capítulo 8 se procede a explicar las relaciones jerárquicas y 
asociativas, mientras que en el capítulo 9 se describe el orden sistemático del 
tesauro, que basamos en el análisis de facetas. 

En el capítulo 10 nos referimos a la evaluación, publicación y actualiza- 
ción como procesos finales y continuos del diseño y desarrollo del tesauro. 
En el capítulo 11 abordamos los modelos, métodos, experiencias y dificulta- 
des de la interoperabilidad entre el tesauro y otros sistemas de organización 
del conocimiento. Por último, en el capítulo 12 resumimos las recomendacio- 
nes para el programa informático de gestión de tesauros, el modelo de datos 
y los formatos de intercambio propuestos para su diseño y desarrollo. 

Finalmente, queremos manifestar nuestro agradecimiento a la Facultad 
de Humanidades y Ciencias de la Educación de la Universidad Nacional de 
La Plata, en especial a la Prosecretaria de Gestión Editorial y Difusión, por la 
posibilidad que nos han brindado de publicar el presente texto. 

Es nuestro deseo que esta obra sea útil para aquellas personas a quienes 
está dirigida. También deseamos que pueda enriquecerse con las críticas, co- 
mentarios y sugerencias que nos hagan conocer. 

Las autoras 


id 


1. La organización del conocimiento 


En esta obra, entendemos que el tesauro es un sistema de organización 
del conocimiento y que su diseño y desarrollo constituyen un conjunto de 
procesos de organización del conocimiento. Para establecer el marco de re- 
ferencia pertinente, comenzaremos por revisar las distintas concepciones de 
la organización del conocimiento -una disciplina emergente- y la diferencia- 
remos de otras áreas. 


El término organización del conocimiento 

La organización del conocimiento -en el sentido que aquí se trata- tiene 
una historia varias veces milenaria, que puede remontarse, entre otros antece- 
dentes, a las bibliotecas sumerias dos mil años a. C. (Dalby, 1986). En tiem- 
pos más cercanos, la organización del conocimiento evolucionó dentro de la 
bibliotecología, la documentación y la ciencia de la información (en adelante 
BDCD), con los aportes de figuras como los estadounidenses Melvil Dewey, 
Charles Ammy Cutter, Henry Evelyn Bliss, Mortimer Taube, Calvin Moers, 
Hans Peter Luhn, los belgas Paul Otlet y Henri La Fontaine, el bibliotecario 
indio Shiyali Ramamrita Ranganathan y los miembros del Classification Re- 
search Group (CRG) de Gran Bretaña, entre los cuales podemos mencionar 
a Bernard 1. Palmer, Arthur J. Wells, Brian C. Vickery, Douglas J. Foskett, 
Barbara Kyle, Jack Mills, Derek W. Langridge, Eric J. Coates, Jason Farra- 
dane y Derek Austin. 

Se acepta que el término organización del conocimiento fue acuñado por 
Henry E. Bliss en dos de sus obras: The organization of knowledge and the 
system of the science y The organization of knowledge in libraries and the 
subject approach to books. Para Bliss, la organización o clasificación de los 
libros en las bibliotecas debía ser consistente con el desarrollo de la ciencia, 
es decir, del conocimiento. Este conocimiento -expresado en la investiga- 
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ción, la enseñanza y la sistematización de los estudios en las universidades, 
así como en las publicaciones académicas- debía determinar el orden de los 
libros en el estante y de los registros bibliográficos en el catálogo sistemático 
(Bliss, 1929, 1933). 

Inicialmente, el término organización del conocimiento no tuvo mayor 
repercusión, pero en la segunda mitad del siglo veinte comenzó a usarse de 
nuevo a partir de las obras del profesor estadounidense Jesse H. Shera (Do- 
cumentation and the organization of knowledge) en 1966 y de los profesores 
alemanes Dagobert Soergel (Dokumentation und Organisation des Wissens) 
e Ingetraut Dahlberg (Grundlagen universaler Wissensordnung) en 1971 y 
1974, respectivamente. 

Desde entonces, la organización del conocimiento ha ido ganando espa- 
cio como un nuevo campo de estudio, particularmente a partir de 1989. Ese 
año, la entonces International Society for Classification cambió su nombre 
por International Society for Knowledge Organization (ISKO) y su revis- 
ta International Classification pasó a llamarse Knowledge Organization. La 
institucionalización de la disciplina y su órgano de difusión no solo han dado 
nuevo impulso a la idea de Bliss, sino que proporcionan además un fuerte 
respaldo académico. 

La corriente de ISKO ha encontrado eco en la región del Mercosur, donde 
distintos autores la han enriquecido con sus contribuciones. Más aún, en el IV 
Encuentro de Directores y III de Docentes de Escuelas de Bibliotecología del 
Mercosur, celebrado en Montevideo del 24 al 27 de mayo de 2000, se resol- 
vió recomendar a la organización del conocimiento como marco referencial 
para la enseñanza de los temas que aquí nos ocupan (Arest € Ceretta, 2001). 


¿Qué es la organización del conocimiento? 

La especialista alemana Ingetraut Dahlberg, fundadora y ex presidente 
de ISKO, recuerda que la existencia de una ciencia descansa sobre el hecho 
de que posee su propio objeto de estudio y su propia área de actividad. Así, 
explica que en el caso de la organización del conocimiento ambos elementos 
se encuentran presentes en el mismo nombre de la disciplina: el conoci- 
miento (objeto) y la organización (actividad). Por tanto, cualquier decla- 
ración científica relacionada con ella debe reducirse a ambos conceptos 
(Dahlberg, 2006a). 
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Respecto al objeto, es decir, el conocimiento, Dahlberg considera que si 
bien es cierto que el conocimiento existe en la mente de una persona y, por 
lo tanto, es subjetivo e individual, también es cierto que puede compartirse 
gracias a la capacidad de los seres humanos para tratar con las cosas del mun- 
do y a su habilidad lingúística para expresar experiencias y puntos de vista. 
Entonces, ¿a qué conocimiento se refiere la organización del conocimiento? 

Para responder esta pregunta recurrimos al profesor Mario G. Barité de 
la Universidad de la República (Uruguay): 


El objeto de estudio de esta disciplina [organización del conocimiento] 
es el conocimiento socializado, entendiendo por tal todo nuevo cono- 
cimiento que se publica y socializa por distintas vías, la mayoría de las 
cuales persigue registrar la paternidad y la defensa de los derechos con- 
siguientes de sus autores o creadores, tanto como la efectiva difusión del 
conocimiento generado o sus aplicaciones (Barité, 2001: 227). 


El profesor José Augusto Chaves de Guimaráes, de la Universidade Esta- 
dual Paulista Júlio de Mesquita Filho (Brasil), coincide con lo anterior cuan- 
do afirma: 


El objeto de investigación de la Organización del Conocimiento reside 
en aquello que Dahlberg (1993: 214) denomina “conocimiento en ac- 
ción”, o sea, algo de lo cual existe un cierto consenso social, un cono- 
cimiento registrado y socializado, cuya organización y representación 
serán desarrollados de modo que a partir de él pueda ser generado nuevo 
conocimiento (Guimaráes, 2008: 85). 


En el mismo sentido, el consultor británico Alan Gilchrist hace referen- 
cia a los profesores japoneses Ikujiro Nonaka e Hirotaka Takeuchi, quienes 
distinguen entre el conocimiento tácito (almacenado en la mente de un indi- 
viduo) y el conocimiento explícito (registrado en un documento). Gilchrist 
(2011) señala que la única aproximación al conocimiento en el área de la 
BDCI es a través del conocimiento explícito. 

Ahora bien, para algunos autores el conocimiento comunicado es justa- 
mente la información, como se deduce de las siguientes afirmaciones: 
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Conocimiento es lo que yo sé. Información es lo que nosotros sabemos, 
es decir, el conocimiento compartido (Foskett, 1996: 3). 

Información es “el contenido de un mensaje” o “algo que es comunica- 
do” (Svenonius, 2000: 7). 

Información: conocimiento que es comunicado (ISO, 2001: 8). 


La comunicación del conocimiento puede ser oral, como sucede por ejem- 
plo cuando se diserta en una conferencia o cuando se debate en una mesa re- 
donda. Para que pueda ser organizado en las bibliotecas, los centros de docu- 
mentación o la World Wide Web, se requiere que el conocimiento socializado 
se registre en un soporte físico (papel, registros audiovisuales, memorias infor- 
máticas, etc.), con lo cual se convierte en un documento (ISO, 2001: 11). 

Entonces, el objeto de la organización del conocimiento es el conoci- 
miento socializado y registrado, explícito o documentado. 

En cuanto a la actividad organización, Dahlberg (2006a) distingue dos 
aplicaciones: 

* Construcción de sistemas de conceptos: consiste en estructurar el co- 
nocimiento contenido en las unidades de conocimiento (conceptos) en 
un orden sistemático, de acuerdo con sus características, para crear un 
sistema de conceptos, por ejemplo un tesauro o un sistema de clasifi- 
cación. Otros autores prefieren llamarlos sistemas de organización del 
conocimiento (SOC), término que adoptamos en esta obra. 
+ Correlación de los conceptos con los objetos de la realidad: se refiere 
a la correlación de los conceptos contenidos en los SOC con aquellos 
expresados en los documentos. Esta correlación incluye: a) la asignación 
de notaciones tomadas de un sistema de clasificación y b) la asignación 
de términos controlados tomados por ejemplo de un tesauro, o palabras 
claves extraídas del propio documento. Estas aplicaciones constituyen 
los principales procesos de la descripción de contenido, es decir, la clasi- 
ficación y la indización. 


Sobre la base de lo anterior, Dahlberg aporta la siguiente definición: 


La Organización del Conocimiento es la ciencia de estructurar y ordenar 
sistemáticamente las unidades de conocimiento (conceptos) de acuerdo 


—-15- 


con sus elementos de conocimiento inherentes (características) y la apli- 
cación de conceptos y clases de conceptos ordenados por esta vía para la 
asignación de contenidos de valor de los referentes (objetos/sujetos) de 
todas clases (2006b). 


En otro artículo, Dalhberg (1993) establece el alcance de la organización 
del conocimiento mediante un esquema de conceptos que se reproduce en el 
Apéndice A de este capítulo. A pesar del tiempo transcurrido y de la necesidad 
de incluir algunas novedades como los mapas conceptuales y las ontologías, 
el esquema de Dahlberg ayuda a comprender de qué se ocupa esta disciplina. 

Por otro lado, la misma Dahlberg (2006a) estima que la organización 
del conocimiento puede considerarse una nueva ciencia y la relaciona con 
el sistema de clasificación Information Coding Classification, elaborado por 
ella misma en 1982. De acuerdo con esto, la ubica en la clase 81 Ciencia de 
la Ciencia y, específicamente, dentro de la 814 Sistematología de la Ciencia 
de la Ciencia. Esto nos recuerda al Broad System of Ordering publicado hace 
más de tres décadas por la Federación Internacional de Documentación y la 
Unesco, de modo que podría incluirse en la clase 116 Ciencia de la Ciencia y 
del Conocimiento (Coates et al., 1981). 

Otros autores también han propuesto definiciones de la organización del 
conocimiento. El profesor Birger Hjgrland de la Aalborg Universitet (Dina- 
marca) define la disciplina en dos sentidos: 


En un sentido estricto, la Organización del Conocimiento (OC) trata so- 
bre actividades tales como la descripción documental, la indización y la 
clasificación llevada a cabo en bibliotecas, bases de datos bibliográficas, 
archivos y otros tipos de instituciones de la memoria por bibliotecarios, 
archivistas, especialistas de información, especialistas en materias, así 
como por algoritmos de computación y personas comunes. La Organiza- 
ción del Conocimiento como campo de estudio se ocupa de la naturaleza 
y calidad de tales procesos organizadores del conocimiento, así como de 
los sistemas organizadores del conocimiento usados para organizar docu- 
mentos, representaciones documentales, obras y conceptos. 

(...) 


En un sentido amplio, la OC trata sobre la división social del trabajo 
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mental, es decir, la organización de universidades y otras instituciones 
de investigación y educación superior, la estructura de las disciplinas y 
profesiones, la organización social de los medios de producción y la di- 
seminación del conocimiento (Ajarland, 2008a: 86). 


La definición de Hjarland, en sentido estricto, abarca tanto los SOC 
como los procesos de organización del conocimiento (POC) y resalta varios 
aspectos: a) el ámbito en el que se llevan a cabo (bibliotecas, bases de datos, 
archivos, etc., a los que en conjunto denomina instituciones de la memoria); 
b) quiénes los llevan a cabo (bibliotecarios, archivistas, especialistas de la 
información) y c) el aporte de los usuarios y de la tecnología informática. 

En cuanto a la definición en un sentido amplio, Hjgrland no se limita -como 
Bliss- al conocimiento desarrollado en las instituciones académicas, sino que 
se extiende también hacia otros organismos productores de conocimiento que 
actúan en la sociedad, como las asociaciones profesionales, las empresas, agen- 
cias de gobierno, organismos no gubernamentales, etc. (La organización del 
conocimiento en sentido amplio escapa al alcance de esta obra). 

Broughton et al.-entre los que se encuentra el propio Hjgrland- también 
distinguen entre el sentido estricto y el sentido amplio de la organización del 
conocimiento. Respecto al sentido estricto aportan la siguiente definición: 


La Organización del Conocimiento (OC), en sentido estricto, trata sobre 
los sistemas organizadores del conocimiento (SOC), tales como los re- 
gistros bibliográficos, los sistemas de clasificación (por ejemplo SCDD, 
LCC y CDU), los tesauros, las redes semánticas y sobre los procesos or- 
ganizadores del conocimiento tales como la clasificación, la descripción 
documental, la “catalogación descriptiva”, la indización y el análisis por 
materia. La OC se lleva a cabo en instituciones de la memoria, tales como 
bibliotecas, archivos, museos y bases de datos en línea y en Internet, pero 
también fuera de tales instituciones, por ejemplo en los índices analíticos 
de los libros y los llamados sistemas de gestión de información persona- 
les [...] La asignación de términos, textos y notaciones a los registros (o a 
los objetos mismos como en los recursos digitales), está relacionada con 
el contenido intelectual o semántico de los recursos y es independiente 
del formato en que la información es presentada. La OC también se inte- 
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resa por el diseño de SOC y los principios y metodologías para construir 
herramientas semánticas (Broughton et al., 2005: 133-134). 


Al igual que la anterior, esta definición abarca los SOC y los POC, pero 
extiende el ámbito de la organización del conocimiento, en sentido estricto, 
más allá de las instituciones de la BDCI, para incluir tanto la industria edito- 
rial que produce los índices analíticos de libros y revistas como los sistemas 
de gestión personales. Señala que los POC se aplican a los registros biblio- 
gráficos, pero también a los registros metadatos que se incrustan o vinculan a 
los recursos digitales disponibles en la Web. Tanto Hjorland como Broughton 
et al incluyen dentro de los POC a los procesos de descripción de contenido 
(clasificación, indización, etc.), pero no son muy explícitos en cuanto al dise- 
ño y desarrollo de SOC, que, como ya se mencionó, también es un conjunto 
de procesos de organización del conocimiento. 

El profesor Claudio Gnoli, de la Universitá degli studi di Pavia (Italia), 
propone un modelo tentativo para estudiar la organización del conocimiento, 
que se basa en una estructura formada por cuatro capas (Gnoli, 2011). La pri- 
mera capa se refiere a las teorías y abordajes del conocimiento que provienen 
de otras disciplinas como la filosofía de la ciencia, la psicología, la sociolo- 
gía, etc. La segunda capa abarca los SOC. La tercera capa, que Gnoli llama de 
representaciones, incluye las normas y formatos de naturaleza técnica como 
MARC, RDF, SKOS u OWL, que permiten representar e intercambiar datos 
en entornos digitales y que constituyen la gran novedad del tramo final del 
siglo veinte y del presente. Por último, la cuarta capa se refiere a la aplicación 
de las teorías, los SOC y las representaciones a los directorios, catálogos, 
bibliografías, etc. de archivos, bibliotecas, museos u otras instituciones simi- 
lares; en otras palabras, la cuarta capa se ocupa de los POC. 

Barité et al., en su Diccionario de organización del conocimiento, apor- 
tan la siguiente definición: 


Área del conocimiento de formación reciente, que estudia las leyes, los 
principios y los procedimientos porlos cuales se estructura el conocimiento 
especializado en cualquier disciplina, con la finalidad de representar 
temáticamente y recuperar la información contenida en documentos de 
cualquier índole, por medios eficientes que den respuesta rápida a las 
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necesidades de los usuarios. La Organización del Conocimiento se nutre 
de los aportes recibidos de la Informática, la Lingúística, la Terminología 
y las Ciencias de la Información. García Marco (1995) señala que 
es “una disciplina científica (esto es, sujeta a método científico) y 
social, de carácter aplicado” pues tiene como objetivo “optimizar la 
circulación del conocimiento en las sociedades”. El objeto de estudio 
de la Organización del Conocimiento es el conocimiento socializado o 
registrado, y en lo que hace a la Bibliotecología y Documentación, da 
cuenta del desarrollo teórico-práctico para la construcción, la gestión, 
el uso y la evaluación de clasificaciones, taxonomías, nomenclaturas, 
ontologías temáticas y lenguajes documentales. Asimismo, ampara el 
conjunto de conocimientos vinculados al análisis de información en 
general, considerando aspectos semánticos, cognitivos e informáticos 
(Barité et al., 2013). 


Para estos autores, la organización del conocimiento abarca la teoría (le- 
yes, principios, conjunto de conocimientos) y se ocupa tanto de los SOC -a 
los que denominan lenguajes documentales- como de los POC (construcción, 
gestión, uso y evaluación de los SOC). Además, reconocen el carácter inter- 
disciplinar de la organización del conocimiento (aspectos semánticos, cogni- 
tivos e informáticos), pero destacan que ocupa un lugar en la BDCI. Cumple 
también con una función (representar y recuperar información, dar respuesta 
al usuario) y adhieren a la concepción de García Marco en cuanto se trata de 
una ciencia social de carácter aplicado. 

Por su parte, el profesor Miguel Ángel Esteban Navarro de la Universi- 
dad de Zaragoza (España) propone otra definición: 


La Organización del Conocimiento es la disciplina específica que se de- 
dica dentro de la Ciencia de la Información Documental al estudio de los 
fundamentos teóricos del tratamiento y la recuperación de la información 
y a la construcción, mantenimiento, uso y evaluación de los instrumen- 
tos lógico-lingúísticos más adecuados para controlar los procesos de re- 
cuperación, clasificación, ordenación y almacenamiento del contenido 
informativo de los documentos con el fin de permitir su recuperación 
y comunicación. Se ocupa, por tanto, de los principios y herramientas 
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puestos en acción para la gestión del conocimiento humano desde una 
triple perspectiva: su representación, su organización y su comunicación 
documental (Esteban Navarro, 1996: 97-98). 


En esta definición también se hace referencia a la teoría, a los SOC (ins- 
trumentos lógico-lingúísticos) y a los POC (construcción de los SOC, recu- 
peración, clasificación, ordenación, almacenamiento), y se considera que la 
organización del conocimiento es una disciplina dentro de lo que este autor 
denomina ciencia de la información documental. 

Más allá de estas definiciones, en 1995 el mismo Esteban Navarro con- 
sideraba, junto al profesor Francisco Javier García Marco de la Universidad 
de Zaragoza, que la organización del conocimiento es una disciplina en for- 
mación. En nuestra opinión, si bien se ha avanzado en distintos aspectos, esta 
afirmación sigue siendo válida: 


La Organización del Conocimiento se encuentra en la actualidad ante dos 
retos comunes a todas las disciplinas científicas durante su nacimiento 
y consolidación. Por una parte, debe definir sus fundamentos gnoseo- 
lógicos, establecer sus principios teoréticos y metodológicos y fijar sus 
límites dentro del mapa de las ciencias para diseñar el tipo de relaciones 
y de intercambio de conocimientos y de métodos que mantendrá con las 
disciplinas concurrentes en su formación o próximas. Y, por otra parte, 
debe acotar su campo de acción en la praxis, construir una teoría ade- 
cuada para analizar la realidad sobre la que actúa y guiar el ejercicio de 
su práctica en ella, y, como complemento, desarrollar los instrumentos 
técnicos necesarios para ejercer adecuadamente esa dimensión práctica. 
En definitiva, se encuentra generando una tecnología (Esteban Navarro 
8 García Marco, 1995: 149-150). 


La organización del conocimiento y las corrientes de la BDCI 

La organización del conocimiento se nutre de otras disciplinas como la 
epistemología, la psicología cognitiva, la sociología del conocimiento y, par- 
ticularmente, de la conceptología, la lingúística, la terminología, la informá- 
tica y la teoría de la comunicación (García Marco, 1995; Guimaráes, 2001a). 

Sin embargo, la BDCI es considerada como “la disciplina central de la Or- 
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ganización del Conocimiento en este sentido estricto” (Hjpgrland, 2008a: 86) y, 
por tal motivo, se ha propuesto a la organización del conocimiento como marco 
teórico referencial para aquellas actividades de la BDCI relacionadas con el 
tratamiento temático del conocimiento explícito o registrado (Barité, 2001). 

En varias publicaciones, Guimaráes ha procurado encuadrar las distintas 
corrientes de la BDCI dentro de la organización del conocimiento (Guimaries, 
2001b, 2008, 2009; Guimaráes et al., 2012). Así, reconoce tres corrientes: 

» Corriente bibliotecológica de origen estadounidense (catalogación de 

materia). 

+ Corriente documental de origen francés (análisis de contenido, análisis 

formal de contenido, descripción de contenido). 

+» Corriente informacional de origen británico (indización). 


El autor destaca que estas corrientes comparten una historia común y 
estudian fenómenos semejantes a pesar de las distintas denominaciones (Gui- 
maríáes, 2009) y concluye que “la organización del conocimiento actúa como 
espacio de agregación entre las demás corrientes, contribuyendo significati- 
vamente para el diálogo entre las mismas” (Guimaries et al., 2012). 


Ámbito de la organización del conocimiento 

Finalmente, puede afirmarse que la organización del conocimiento ya no 
es patrimonio exclusivo de las bibliotecas, centros de documentación y otras 
instituciones de la BDCL, sino que se ha extendido a otros organismos que 
gestionan conocimiento —como las empresas, agencias de gobierno u otros 
organismos—, y a la World Wide Web. Como afirma María Inés Cordeiro, ex 
directora de la Biblioteca Nacional de Portugal y asesora del Consorcio CDU: 


La Organización del Conocimiento ha sido siempre reconocida como 
una de las funciones primarias de las bibliotecas, que han sido uno de los 
principales proveedores de este servicio. Los profundos cambios intro- 
ducidos por Internet han incrementado el interés acerca del conocimiento 
y de la Organización del Conocimiento, diversificando las perspectivas 
acerca de la gestión de conocimiento. El campo se ha vuelto más comple- 
jo y menos claro como campo profesional. De repente, la Organización 
del Conocimiento se encuentra a sí misma en la múltiple encrucijada 
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del paisaje sobrecargado y distribuido de la información generado por la 
WWW (Cordeiro, 2003: 66). 


Organización del conocimiento vs. organización 
de la información 

Algunos especialistas limitan la organización del conocimiento al diseño 
y desarrollo de SOC, pero consideran que la descripción de contenido es 
incumbencia de la ciencia de la información (Bráscher 8: Café, 2008; Café 
et al., 2012). 

Otros, por el contrario, consideran que esta disciplina se ocupa solamen- 
te de la descripción de contenido. Por ejemplo, el profesor emérito James D. 
Anderson, de la Rutgers University (Estados Unidos), propone una definición 
que toma en cuenta la indización, la clasificación, etc., pero no hace referencia 
al diseño y desarrollo de los SOC necesarios para llevar a cabo esos procesos: 


La Organización del Conocimiento en Bibliotecología y Ciencia de la In- 
formación consiste en diversos aspectos: identificación de los mensajes 
(con frecuencia llamados obras); identificación de los textos en los cuales 
se representan los mensajes (obras); descripción de los documentos en 
los cuales se presentan los textos; y descripción del contenido, caracterís- 
ticas y significado de los mensajes. Las identificaciones y descripciones 
resultantes se organizan en índices, catálogos, bases de datos, bibliotecas 
digitales y otros sistemas de recuperación de información para el acceso 
de los interesados. La creación y organización de estas identificaciones y 
descripciones se llaman indización, condensación, catalogación, clasifi- 
cación bibliográfica, bibliografía, gestión de registros y gestión de cono- 
cimiento, en varios contextos (Anderson, 2003: 471-472). 


Otros autores rechazan terminantemente el concepto “organización del 
conocimiento” y prefieren “organización de la información”, como la pro- 
fesora emérita de la University of Pittsburg (Estados Unidos) Arlene G. 
Taylor y el profesor emérito de la University of Sheffield (Gran Bretaña) 
Tom D. Wilson: 


El conocimiento existe en la mente de un individuo que ha estudiado una 
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materia, la ha comprendido y quizás ha contribuido con algo a través de la 
investigación u otros medios [...] la información es la comunicación o re- 
cepción de conocimiento [...] Así, elegí usar el término información en lugar 
de conocimiento como expresión de lo que creo que nosotros organizamos 
cuando organizamos en beneficio de otras personas (Taylor, 2004: 3). 


El conocimiento involucra los procesos mentales de comprensión, enten- 
dimiento y aprendizaje que ocurren en la mente y solo en la mente [...] 
Siempre que deseamos expresar lo que conocemos, solo podemos hacer- 
lo por mensajes de uno u otro tipo: orales, escritos, gráficos, gestuales o 
incluso a través del lenguaje corporal. Tales mensajes no portan conoci- 
miento, ellos constituyen información que una mente cognoscente puede 
asimilar, entender, comprender e incorporar a sus propias estructuras de 
conocimiento [...] La consecuencia de este análisis es que todo lo externo 
a la mente que pueda ser manipulado en cualquier forma, puede definirse 
como “datos”, si consiste en simples hechos, o como “información”, si los 
datos están incorporados en un contexto de relevancia para el receptor [...] 
De modo que los datos y la información pueden ser gestionados, los recur- 
sos de información pueden ser gestionados, pero el conocimiento (es decir, 
lo que conocemos) nunca puede ser gestionado, excepto por el individuo 
que conoce y, aun así, solo imperfectamente (Wilson, 2002). 


Representación y organización del conocimiento 

Algunos autores, en particular del ámbito iberoamericano, prefieren el 
término representación y organización del conocimiento (Esteban Navarro, 
1996; Esteban Navarro € García Marco, 1995) o bien al revés, organiza- 
ción y representación del conocimiento (Fujita, 2008; Guimaries et al, 2012; 
Peña Vera, 2010, 2011). La revista Scire: representación y Organización del 
Conocimiento,' publicada por la Facultad de Filosofía y Letras de la Univer- 
sidad de Zaragoza, España, hace referencia al término en cuestión tanto en el 
subtítulo como en su política editorial. 

Según la profesora venezolana Tania Peña Vera (2010, 2011) los proce- 
sos de representación incluyen la descripción, la catalogación, la indización 


¡Scire: http://www.ibersid.eu/ojs/index.php/scire/index 
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y la condensación, mientras que para Esteban Navarro (1996) comprenden la 
indización y la condensación. Ambos autores coinciden en que los procesos 
de organización son la clasificación y la ordenación. 

Estos procesos de representación se limitan a los POC de la descrip- 
ción de contenido, pero el diseño y desarrollo de SOC también incluye otros 
procesos de representación. Por eso, adherimos a la posición de Dahlberg 
(2006a), para quien la organización del conocimiento comprende la represen- 
tación como una forma necesaria para comunicar el conocimiento individual 
que es subjetivo, compararlo con las representaciones de otras personas y con- 
trastarlo con la realidad para verificar su verdad. La representación del conoci- 
miento -afirma Dahlberg- se ocupa tanto de la estructura lógica de los concep- 
tos (conceptología) como de la designación de estos (terminología) y distingue 
cuatro niveles de representación, de lo más simple a lo más complejo: 

+ Elementos de conocimiento: son las características de los conceptos 

a partir de las cuales se pueden predicar las propiedades o hacer decla- 

raciones sobre los objetos. Las características son abstracciones de las 

propiedades de los objetos del mundo real o del ideal, que se expresan 
mediante enunciados. 

* Unidades de conocimiento o conceptos: son representaciones mentales 

de los objetos del mundo real o del ideal y constituyen la síntesis de las 

características. Se expresan mediante designaciones verbales o simbóli- 
cas como los términos preferentes de un tesauro o las notaciones de un 
sistema de clasificación. 

* Unidades de conocimiento amplias: son combinaciones de conceptos, 

como pueden ser las declaraciones, las definiciones y los textos. 

* Sistemas de conocimiento: son estructuras planificadas y cohesivas que 

ordenan los conceptos de un determinado dominio, por ejemplo un siste- 

ma de clasificación o un tesauro. 


Entonces, hay representación del conocimiento en la indización y la con- 
densación, que son procesos de la descripción de contenido, pero también hay 
representación en un tesauro, en un sistema de clasificación o en otros SOC. 

La misma Dahlberg (2006a) considera que la representación del conoci- 
miento es parte de la organización del conocimiento y por lo tanto basta con 
este último término, que en definitiva es el que se ha generalizado. De nuevo 
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Esteban Navarro €: García Marco (1995) ofrecen una explicación: 


Se trata, por tanto, de una ciencia tridimensional, ya que se ocupa de los 
principios, métodos e instrumentos puestos en acción para la gestión del 
conocimiento humano desde una triple perspectiva: su representación, su 
organización y su comunicación documental. No obstante, la Ciencia de 
la Representación, Organización y Comunicación del Conocimiento se 
denomina de modo más simple y breve Organización del Conocimiento, 
debido a que la organización es el elemento mediador entre los otros dos 
actos, ya que, por un lado, la representación se efectúa con la finalidad de 
permitir una eficaz organización, y, por otro, la comunicación exige una 
correcta recuperación, cuyo éxito depende de la calidad de la organiza- 
ción (Esteban Navarro €: García Marco, 1995: 149). 


Organización del conocimiento y gestión del conocimiento 

El término organización del conocimiento no debe confundirse con otro 
término de amplia difusión en años recientes que es gestión del conocimiento. 
Este último se refiere a una nueva forma de gestión para las empresas u otros 
organismos, basada en el reconocimiento de que su principal activo es el ca- 
pital intelectual, es decir, el conocimiento que poseen las personas que allí se 
desempeñan. La gestión del conocimiento es: 


Un proceso sistémico y específico de cada organismo para adquirir, orga- 
nizar y comunicar el conocimiento de los empleados, de modo que otros 
empleados puedan hacer uso de ese conocimiento para ser más efectivos 
y productivos en su trabajo (Gottschalk, 2007: 25). 


En este marco y a partir del trabajo pionero de Nonaka y Takeuchi, se ha 
distinguido entre conocimiento tácito y conocimiento explícito (Choo, 2003). 
Como ya se mencionó, el conocimiento tácito es aquel que existe en la mente 
de las personas y se manifiesta a través de sus acciones. El conocimiento 
explícito es el que ha sido formalizado y documentado en manuales de proce- 
dimientos, especificaciones técnicas, instructivos, normas, etc. 

Un sistema de gestión de conocimiento debe procurar que la mayor can- 
tidad posible de conocimiento tácito se convierta en conocimiento explícito, 
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porque es este último el que puede ser gestionado. En este sentido, Choo 
(2003) señala que uno de los proyectos más importantes de la gestión del 
conocimiento es la creación de repositorios institucionales que tienen como 
objetivo capturar el conocimiento registrado y organizarlo de modo que pue- 
da ser recuperado fácil y rápidamente. 

En consecuencia, dentro de un sistema de gestión del conocimiento, la 
organización del conocimiento es útil para: a) la descripción del contenido de 
aquellos documentos que formarán parte del repositorio institucional y b) el 
diseño y desarrollo de SOC específicos, particularmente tesauros, taxonomías 
y ontologías que serán aplicados al sitio Web y la intranet del organismo. 

De este modo, podemos decir que en el ámbito de un organismo público 
o privado, la organización del conocimiento puede ser de utilidad para la ges- 
tión del conocimiento, de una manera similar -aunque no idéntica- a lo que 
ocurre en una biblioteca. 
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Autoevaluación 

En el ámbito de la bibliotecología, la documentación y la ciencia de 
la información, ¿quién fue el primero en utilizar el término organización 
del conocimiento? ¿Quiénes retomaron el término en la segunda mitad del 
siglo veinte? 
¿Cuál es el objeto de estudio de la organización del conocimiento? 
¿De qué se ocupa la organización del conocimiento? 
¿Cuál es su función? 
¿Quién la lleva a cabo? 


¿En qué ámbitos se lleva a cabo? 


La organización del conocimiento, ¿es una ciencia, una disciplina, una espe- 
cialidad o un campo de conocimiento? 


Con las respuestas de las preguntas b a g redacte su propia definición de or- 
ganización del conocimiento. 


¿Cuál es la diferencia entre organización del conocimiento y gestión del co- 
nocimiento? 


¿De qué manera puede contribuir la organización del conocimiento a la ges- 
tión del conocimiento? 


== 


Apéndice A. Alcance de la organización del conocimiento? 


0 Divisiones de forma 

01 Bibliografías 

02 Revisiones bibliográficas 

03 Diccionarios, terminologías 

04 Sistemas de clasificación y tesauros 
05 Publicaciones periódicas y series 
06 Actas de congresos 

07 Libros de texto 

08 Otras monografías 

09 Normas, directrices 


1 Fundamentos teóricos y problemas generales 

11 Orden y organización del conocimiento 

12 Conceptología y organización del conocimiento 

14 Teoría de sistemas y organización del conocimiento 
15 Psicología y organización del conocimiento 

16 Ciencia y organización del conocimiento 

17 Problemas en organización del conocimiento 

18 Investigación de la organización del conocimiento 
19 Historia de la organización del conocimiento 


2 Sistemas de clasificación y tesauros: estructura y construcción 

21 Cuestiones generales de sistemas de clasificación y tesauros 

22 Estructura y elementos de sistemas de clasificación y tesauros 

23 Construcción de sistemas de clasificación y tesauros 

24 Relaciones 

25 Taxonomía numérica 

26 Notación. Códigos 

27 Mantenimiento, actualización y almacenamiento de sistemas de clasifica- 
ción y tesauros 

28 Compatibilidad y concordancia entre sistemas de clasificación y tesauros 


?Traducido de Dahlberg, 1993. 
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29 Evaluación de sistemas de clasificación y tesauros 


3 Clasificación e indización: metodología 

31 Teoría de clasificación e indización 

32 Análisis por materia 

33 Técnicas de clasificación e indización 

34 Clasificación e indización automáticas 

35 Ordenamiento manual y automatizado 

36 Codificación 

37 Reclasificación 

38 Generación de índices 

39 Evaluación de la clasificación y la indización 


4 Sistemas de clasificación y tesauros universales 

41 Sistemas de clasificación universales en general 

42 Clasificación decimal universal 

43 Sistema de clasificación decimal de Dewey 

44 Clasificación y epígrafes de Library of Congress 

45 Bliss bibliographic classification 

46 Colon classification 

47 Library bibliographical classification 

48 Otros sistemas de clasificación y tesauros universales 
49 (Vacía) 


5 Taxonomías especializadas en 
51 Forma y estructura 

52 Energía y materia 

53 Cosmos éx geografía 

54 Biología 

55 Humanidades 

56 Ciencias sociales 

57 Economía y tecnología 

58 Ciencia e información 

59 Cultura 
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6 Sistemas de clasificación y tesauros especializados en 
61 Forma y estructura 

62 Energía y materia 

63 Cosmos éx geografía 

64 Biología 

65 Humanidades 

66 Ciencias sociales 

67 Economía y tecnología 

68 Ciencia e información 

69 Cultura 


7 Representación del conocimiento por lengua natural y terminología 
71 Problemas generales de la lengua natural respecto a la organización del 
conocimiento 

72 Semántica 

73 Procesamiento automático de la lengua 

74 Problemas gramaticales 

75 Sistemas y tecnología de recuperación en línea 

76 Problemas de léxicos/diccionarios 

77 Problemas de terminología 

78 Terminología orientada por materia 

79 Problemas de sistemas multilingúes y traducción 


8 Clasificación e indización aplicada 

81 Problemas generales, catálogos, directrices, reglas, índices 

82 Clasificación e indización de datos 

83 Clasificación e indización de títulos 

84 Clasificación e indización de información primaria (excepto 85) 
85 Clasificación e indización del texto de los libros 

86 Clasificación e indización de información secundaria 

87 Clasificación e indización de materiales distintos al libro 

88 Clasificación e indización en campos temáticos 

89 Clasificación e indización en ciertas lenguas 


9 Ambiente de la organización del conocimiento 
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91 Problemas profesionales y organizacionales 

92 Personas e instituciones en la organización del conocimiento 

93 Organizaciones de clasificación e indización en el nivel nacional e inter- 
nacional 

94 (Vacía) 

95 Educación y entrenamiento en organización del conocimiento 

96 Cuestiones legales en organización del conocimiento 

97 Aspectos económicos en organización del conocimiento 

98 Estudios de usuarios y organización del conocimiento 

99 Normalización en organización del conocimiento 
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2. Sistemas y procesos de organización 
del conocimiento 


Como se expuso en el capítulo1, la organización del conocimiento se 
ocupa de sistemas y procesos, que trataremos de explicar a continuación, así 
como el uso de la lengua natural en los procesos de organización y recupera- 
ción del conocimiento registrado. 


Sistemas de organización del conocimiento 

A lo largo de los años se han acuñado diferentes y numerosos términos 
para designar el mismo o casi el mismo concepto: lenguajes de indización, 
lenguajes documentales, lenguajes documentarios, lenguajes de recuperación 
de información, lenguajes de materias, lenguajes terminológicos, vocabula- 
rios controlados, vocabularios estructurados, vocabularios controlados y es- 
tructurados (IFLA, 2011: 84). A estos términos se han sumado otros más re- 
cientes: sistema de organización del conocimiento (Hjerppe, 1990) y sistema 
organizador del conocimiento (Hjgrland, 2008a). También se han propuesto 
sistema de representación y organización del conocimiento (Esteban Nava- 
rro, 1996), instrumento de organización del conocimiento (Fujita, 2008) y he- 
rramienta de organización del conocimiento (Neelamegan € Lala, 2013). 

Esta diversidad terminológica es producto de distintas corrientes y con- 
cepciones de los especialistas en el tema. Aquí elegimos el término siste- 
ma de organización del conocimiento porque se relaciona directamente con 
la disciplina a la que nos referimos y porque ha logrado mayor difusión en 
la última década. Este término comenzó a utilizarse en la década de 1990 
(Hjerppe, 1990, 1996), pero parece haber obtenido más repercusión a partir 
del primer congreso de la ACM Digital Libraries, que se llevó a cabo en 
Pittsburgh, Estados Unidos, en 1998 (Hodge, 2000). Desde entonces, se han 
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hecho intentos por definirlo, aunque todavía no se ha llegado a un acuerdo y 
de hecho existen distintas posiciones entre los expertos. 

Una primera posición, tal vez la más difundida, es la de aquellos que han 
puesto el énfasis en establecer una tipología de los SOC y se conforman con 
una definición por extensión, que abarque los distintos tipos. En el año 2000, 
la especialista estadounidense Gail Hodge preparó un informe para la Digital 
Library Federation, avalado por el Council on Library and Information Re- 
sources de su país, en el que aporta la siguiente definición de SOC: 


El término sistemas de organización del conocimiento intenta abarcar 
todos los tipos de esquemas para organizar la información y promover la 
gestión de conocimiento. Los sistemas de organización del conocimiento 
incluyen los esquemas de clasificación y categorización que organizan 
los materiales en un nivel general, los encabezamientos de materia que 
proporcionan acceso más detallado y los archivos de autoridades que 
controlan las versiones variantes de la información clave como los nom- 
bres geográficos y personales. Los sistemas de organización del conoci- 
miento también incluyen vocabularios altamente estructurados, como los 
tesauros, y los esquemas menos tradicionales, como las redes semánticas 
y las ontologías. Debido a que los sistemas de organización del conoci- 
miento son mecanismos para organizar información, están en el corazón 
de cada biblioteca, museo y archivo (Hodge, 2000: 1). 


Como se puede observar, la definición anterior no enuncia las caracterís- 
ticas de los SOC sino que solamente enumera los distintos tipos que abarca 
este término. En su informe, Hodge propone una tipología de los SOC que 
incluye las siguientes categorías: 

* Listas de términos: listas de autoridades, glosarios, diccionarios, listas 

de nombres geográficos. 

*» Clasificaciones y categorías: encabezamientos de materia, sistemas de 

clasificación. 

» Listas de relaciones: tesauros, redes semánticas, ontologías. 


Otros autores europeos, basados en la definición de Hodge, también con- 
sideran que el término sistema de organización del conocimiento comprende 
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tesauros, listas de términos, ontologías, sistemas de clasificación, taxono- 
mías, listas de nombres geográficos, diccionarios, bases de datos léxicas, ma- 
pas conceptuales y espaciales, mapas de ruta semánticos, etc. (Hill 8 Koch, 
2001; Tudhope 8z Koch, 2004). 

En 2006, los profesores Douglas Tudhope de la University of Glamorgan 
(Gran Bretaña), Traugott Koch de la Lunds Universitet (Suecia) y la experta 
Rachel Heery de UKOLN (Gran Bretaña) presentaron un informe al Joint In- 
formation System Committee de Gran Bretaña, en el que clasifican los SOC 
por su estructura y su propósito (Tudhope et al., 2006). 

De acuerdo con su estructura, estos autores clasifican los SOC como sigue: 

* Listas de términos no estructuradas: listas de selección (pick lists), listas 

de autoridades, glosarios, diccionarios, anillos de sinónimos. 

+ Taxonomías: sistemas taxonómicos científicos, taxonomías Web, taxo- 

nomías corporativas. 

+ Encabezamientos de materia: listas de epígrafes generales como LCSH 

o especializadas como MeSH. 

+ SOC basados en relaciones: tesauros, sistemas de clasificación, bases 

de datos léxicas (por ejemplo WordNet) y ontologías. 


Los mismos autores agrupan los SOC de acuerdo con su función de la 
siguiente manera: 

+ Con fines de recuperación: SOC destinados a la clasificación e indiza- 

ción en catálogos de bibliotecas, bibliografías, bibliotecas digitales, etc. 

+ Con fines lingúísticos: los SOC utilizados en la traducción asistida por 

computadora, la ingeniería de lenguaje, la minería de textos y las bases 

de datos léxicas como WordNet. 

+ Con fines de inteligencia artificial: las ontologías. 

+ Con fines de e-aprendizaje (e-learning): los metadatos para objetos de 

aprendizaje y sus repositorios, muchas veces ligados a las bibliotecas 

digitales. 

* Con fines científicos: las taxonomías y nomenclaturas científicas, entre otros. 


La profesora Marcia Lei Zeng de la Kent State University (Estados Uni- 


dos), basándose también en el trabajo de Hodge y el de Tudhope et al., pro- 
pone cuatro categorías para clasificar los SOC por su estructura (Zeng, 2008): 
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* Listas de términos: incluye las listas de selección, diccionarios, glosa- 
rios y anillos de sinónimos. 

+ Modelos similares a metadatos: listas de autoridades, directorios, listas 
de nombres geográficos. 

* Clasificación y categorización: encabezamientos de materia, esquemas 
de categorización, taxonomías, sistemas de clasificación. 

+ Modelos de relaciones: tesauros, redes semánticas, ontologías. 


Tabla 1 - Características de los SOC según sus funciones 







Glosarios, diccionarios, 
listas de términos 


Anillos de sinónimos 





Listas de autoridades, 
directorios, listas de XXX 
nombres geográficos 





Sistemas de clasifica- 
ción, esquemas de cate- 
gorización, taxonomías, 

listas de epígrafes 





Tesauros XXX 





Ontologías ON 























Zeng reconoce cinco funciones de los SOC que se muestran en la Tabla 1. 
Como se puede observar, no todos los SOC cumplen con todas las funciones 
o no lo hacen en el mismo grado. 

Por su parte, los profesores Renato Rocha Souza y Mauricio Barcellos Al- 
meida, de la Universidade Federal de Minas Gerais (Brasil), junto al ya men- 
cionado Douglas Tudhope, han analizado en sucesivos artículos distintas pro- 
puestas de otros autores, a partir de lo cual presentan una tipología de los SOC 
con un criterio amplio, que no es mutuamente excluyente, de modo que algunos 
SOC han sido clasificados en más de una categoría (Souza et al., 2010, 2012). 
Según el tipo de estructura, los SOC se dividen de la siguiente manera: 
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+ Texto no estructurado: resúmenes, surrogados. 

+ Listas de términos y/o conceptos: folksonomías, diccionarios, glosa- 
rios, listas de autoridades, listas de etiquetas, anillos de sinónimos, líneas 
de concordancia, vocabularios controlados. 

* Estructuras de conceptos y relaciones: vocabularios controlados, siste- 
mas de clasificación, esquemas de categorización, encabezamientos de 
materia, índices para la recuperación de información, diccionarios de da- 
tos, taxonomías, tesauros, redes semánticas, ontologías. 

+ Estructuras de conceptos, relaciones y distribución: mapas mentales, 
mapas argumentales, mapas conceptuales, rich pictures (representacio- 
nes de conceptos mediante imágenes), modelos entidad-relación, mode- 
los referenciales, modelos de datos. 


Las tipologías anteriores son propuestas y, por lo tanto, están sujetas a 
discusión, ya que de hecho no coinciden totalmente entre ellas, ni se ajustan 
a una definición precisa que exprese sin ambigiiedad las características esen- 
ciales de un SOC. El tema requiere un análisis más profundo que excede el 
alcance de esta obra. 

En una segunda posición encontramos a Birger Hjgrland, mencionado 
anteriormente, quien utiliza en sus textos dos términos similares, pero no 
idénticos, para referirse a los SOC: a) knowledge organization systems, que 
puede traducirse como sistemas de organización del conocimiento (Hjgr- 
land, 2008b) y b) knowledge organizing systems o sistemas organizadores 
del conocimiento (Hjarland, 2008a). Para Hjerland se trata de un “término 
general que se refiere, entre otras cosas a las herramientas que presentan una 
interpretación organizada de las estructuras del conocimiento” (Hjsrland, 
2008b). También analiza los SOC en un sentido amplio y en un sentido es- 
tricto (Figura 1). 

En el sentido amplio de los SOC, Hjarland incluye las bibliografías, las 
teorías y sistemas conceptuales, las culturas y subculturas, las disciplinas y 
la división social del trabajo, las enciclopedias, los medios de comunicación, 
las lenguas y los sistemas simbólicos, los modelos de actores, sistemas y pro- 
cesos en diferentes dominios, etc. En un sentido estricto, es decir, en el área 
de la BDCI, Hjarland agrupa ciertos SOC a los que denomina herramientas 
semánticas y postula la siguiente definición: 
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Una herramienta semántica es una herramienta que proporciona informa- 
ción semántica, esto es información acerca del significado de las palabras 
y otros símbolos, así como las relaciones entre símbolos y conceptos 
(relaciones semánticas) (Hjorland, 2007b). 


Figura 1. Sistemas de organización del conocimiento (SOC), 
según Hjorland (2006-2008b). 
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Entre las herramientas semánticas, Hjorland incluye los lenguajes de in- 
dización, que define como “lenguas usadas para la clasificación o la indiza- 
ción de las materias de los documentos” (Hjorland, 2006) y los divide en dos 
grandes grupos: a) los sistemas de clasificación y b) los lenguajes de indiza- 
ción verbales, ya sean libres o controlados (tesauros, listas de epígrafes, etc.), 
que se distinguen según su forma de coordinación. Dentro de las herramien- 
tas semánticas se incluyen también los mapas conceptuales, los hipertextos, 
los anillos de sinónimos, tipologías, folksonomías y aquellos otros incluidos 
en la tipología de Hodge. 

Según Hjorland, las herramientas semánticas tienen semejanzas y dife- 
rencias. Por un lado, comparten dos características: a) de una u otra forma 
despliegan un conjunto de símbolos y conceptos, y b) proporcionan infor- 
mación acerca de las relaciones semánticas entre los conceptos desplegados. 
Así, los conceptos son las unidades de conocimiento que se organizan, y la 
manera en que se organizan es de acuerdo con su significado, es decir, de 
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acuerdo con las relaciones semánticas entre los conceptos. Por otro lado, las 
herramientas semánticas se diferencian entre sí por la clase de símbolos y los 
conceptos seleccionados y por la información proporcionada acerca de cada 
concepto, en particular sus relaciones semánticas. 

Broughton et al. coinciden en su preferencia por el término sistemas or- 
ganizadores del conocimiento y en el enfoque sobre el sentido amplio y el 
sentido estricto de los SOC. Definen el término en sentido estricto como “ti- 
pos de herramientas semánticas que proporcionan la selección de conceptos 
e información acerca de sus relaciones semánticas” (Broughton et al., 2005: 
142) e incluyen los siguientes: 

+ Sistemas de clasificación como SCDD, CDU, LCC 

» Sistemas de clasificación facetados como la segunda edición de BC 

» Listas de epígrafes como LCSH 

+» Sistemas basados en la búsqueda por texto libre 

* Tesauros 

+ Mapas bibliométricos 

+ Algoritmos de los motores de búsqueda 

* Sistemas de archivo (basados en el principio de procedencia) 

+ Ontologías 

+ Redes semánticas 

+ Mapas de tópicos 


De modo que para los autores que proponen esta segunda posición, sis- 
tema de organización del conocimiento es un concepto amplio que incluye 
—entre otros, pero no exclusivamente— las herramientas semánticas, y son 
estas últimas las que coinciden, al menos en parte, con las tipologías de los 
SOC propuestas por los autores de la primera posición. 

Otros autores iberoamericanos consideran que sistema de organización del 
conocimiento es lo mismo que lenguaje documental o lenguaje documentario: 


Los SOC también llamados “lenguajes documentales”, “sistemas organi- 
zadores del conocimiento” o “sistemas de organización y representación 


del conocimiento” [...] (Barité et al., 2013). 


Los lenguajes documentarios, caracterizados como sistemas de organiza- 
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ción del conocimiento y correspondientes a las listas de encabezamientos 
de materia y a los tesauros, tienen como primera función representar el 
contenido de los documentos contenidos en un sistema de recuperación de 
información función por el contenido y, como segunda función, mediar la 
recuperación de información por medio de la representación de las pregun- 
tas formuladas por los usuarios, función por el uso (Boccato, 2009: 120). 


También nosotros hemos afirmado anteriormente que a los SOC “se los 
ha conocido como lenguajes documentales” (Martínez Tamayo €: Valdez, 
2009: 28), pero debe tenerse en cuenta que los SOC van más allá de los 
tradicionales sistemas de clasificación, listas de epígrafes y tesauros y que 
exceden el campo de la BDCI. 

Finalmente, llama la atención que ninguna de las definiciones y tipolo- 
gías anteriores haga referencia a que un SOC es, precisamente, un sistema. 
Por ende no declaran, de manera explícita y completa, cuáles son los elemen- 
tos componentes de este sistema, cómo se interrelacionan y estructuran, ni 
cuál es su propósito. En ese sentido, recordamos que Dahlberg (2006a) los 
llama sistemas de conceptos y coincidimos con la recomendación de Esteban 
Navarro (1996) respecto a que la definición del término debe basarse en el 
análisis de las palabras que lo forman. 

Así, en esta obra definimos el término sistema de organización del conoci- 
miento como un sistema, y específicamente como un sistema de conceptos. Los 
componentes del sistema son, por lo tanto, los conceptos de un dominio, expre- 
sados por designaciones unívocas (notaciones, epígrafes, términos preferentes, 
etc.), interconectados mediante distintos tipos de relaciones y estructurados en 
un orden determinado. En el área de la BDCI, la función de un SOC es facilitar 
la organización y recuperación del conocimiento registrado. Son ejemplos de 
SOC para la BDCI los sistemas de clasificación, las listas de epígrafes, las listas 
de autoridades, los tesauros, las taxonomías y las ontologías. 


Lengua natural y organización del conocimiento 

La lengua natural también se utiliza en el proceso de búsqueda, por ejem- 
plo en aquellos sistemas de recuperación que permiten buscar por las pala- 
bras claves de título, de resumen o del texto completo del documento. No 
obstante, presenta algunas dificultades derivadas principalmente de la sinoni- 
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mia y la homonimia. Por ejemplo, si el autor de un documento utiliza el tér- 
mino “canes”, el usuario no podrá recuperarlo usando el término de búsqueda 
“perros”. Si el usuario busca el término “violeta? por interés en la flor, también 
recuperará documentos sobre el color violeta o las personas de nombre Vio- 
leta. En otras palabras, el usuario final de un sistema de recuperación puede 
perder información debido a la sinonimia y obtener recuperaciones falsas a 
causa de la homonimia. Para solucionar estos problemas es necesario recurrir 
a un SOC porque su vocabulario es unívoco. 

Durante largo tiempo se ha planteado la controversia respecto a la recu- 
peración por lengua natural o por medio de un SOC como si fueran antagó- 
nicos, cuando en realidad son complementarios. Elaine Svenonius (1986) y 
Jennifer Rowley (1994) han distinguido en esto varias eras, a partir del siglo 
diecinueve. 

La primera era comenzó con el bibliotecario británico Samson Low, 
quien en 1854 indizó el British catalogue of books utilizando palabras claves 
del título de los libros, es decir, la lengua natural usada por los autores. Su 
discípulo Andrea Crestadoro llevó a cabo una experiencia similar con el catá- 
logo de la Manchester Free Library. 

Por el contrario, cuando el estadounidense Charles A. Cutter publicó en 
1876 las primeras reglas para redactar los epígrafes y Melvil Dewey hizo lo 
propio con su sistema de clasificación, dieron lugar a los primeros SOC. Ha- 
cia la primera mitad del siglo veinte la práctica habitual en las bibliotecas era 
indizar con una lista de epígrafes y clasificar con un sistema de clasificación. 
En esta era surgieron los SOC universales y precoordinados más conocidos: 
LCSH, Sears, SCDD, CDU, CC, BC. 

La segunda era se inicia con la aparición, a partir de 1958, de los prime- 
ros índices realizados con una computadora: los famosos KWIC, KWOC y 
KWAC, elaborados mediante la extracción automática de las palabras claves 
del título de los documentos. Esta técnica abrió de nuevo el debate entre la 
lengua natural y los SOC. La controversia se vio reforzada aún más por los 
llamados estudios de Cranfield, llevados a cabo en Gran Bretaña entre 1957 
y 1962. En particular los resultados de Cranfield 2 señalaban que la lengua 
natural, sin control o con un mínimo de control de vocabulario, lograba una 
recuperación tan eficiente como los SOC (Dubois, 1987; Lancaster, 2002; 
Rowley, 1994; Svenonius, 1986). Entonces, ¿para qué gastar dinero y es- 
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fuerzo en el diseño de un SOC y en la indización realizada por humanos, si 
basta con la lengua natural y una computadora programada para extraer las 
palabras claves? 

La tercera era se inicia justamente con la proliferación de las bases de 
datos bibliográficas y los catálogos en línea, que permitieron llevar a cabo 
nuevas investigaciones sobre el desempeño de los usuarios en la búsqueda 
por materia, entre ellos el estudio realizado por Carol Tenopir (1985) sobre 
la base de datos Harvard Business Review de texto completo. Estas investi- 
gaciones demostraron que tanto la búsqueda por lengua natural como aquella 
por medio de un SOC ofrecen resultados efectivos, pero distintos. Para acla- 
rar mejor esta idea, es necesario explicar primero las ventajas y desventajas 
que ofrecen tanto la lengua natural como los SOC para la recuperación, así 
como dos variables de medición que son las tasas de precisión y acierto. 

En la Tabla 2 se comparan las ventajas y desventajas de la lengua natural y los 
SOC para la recuperación de información (Aitchison et al., 2000; Dubois, 1987). 


Tabla 2. Lengua natural vs. SOC 


Mayor especificidad Menor especificidad 
Mayor exhaustividad Menor exhaustividad 
Actualización inmediata Actualización mediata 
Evita errores del indi- Permite errores del 

zador indizador 
El usuario utiliza sus entaja: El usuario tiene que 
propios términos aprender los términos 
Bajos costos en el alma- Altos costos en el alma- 
cenamiento cenamiento 
Compatibilidad con otras Incompatibilidad con 
bases de datos otras bases de datos 


Problemas de sinonimia Control de sinónimos, 
y homonimia, singular y homónimos y formas 
plural gramáticas 
Se pierden conceptos taja Expresa conceptos 
implícitos implícitos 
Puede haber asociación Términos multipalabra 
incorrecta de términos normalizados 
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Por otro lado, los experimentos de Cranfield introdujeron dos variables 
operativas para medir el desempeño de los sistemas de recuperación (Claver- 
don é€z Mills, 1985; Foskett, 1996; Lancaster, 2002). Las variables son: 

* Tasa de precisión: es la proporción de documentos recuperados que son 

relevantes. Dicho de otra manera, es la capacidad de reducir o limitar una 

búsqueda, hasta recuperar si se necesita un solo recurso. 

*» Tasa de acierto: es la proporción de documentos relevantes que son re- 

cuperados, es decir, la capacidad de ampliar una búsqueda o de encontrar 

todos los recursos que tratan sobre un mismo tema. 


Entonces, los estudios a los que hacíamos referencia, realizados sobre 
bases de datos de texto completo, demostraron que la lengua natural y los 
SOC pueden mejorar tanto la precisión como el acierto, pero de diferente 
manera (Dubois, 1987; Rowley, 1994; Svenonius, 1986; Tenopir, 1985): 

+ La lengua natural mejora la precisión por el mayor nivel de especi- 

ficidad y la actualización de sus términos, mientras que los SOC lo 

hacen mediante el uso de frases o términos multipalabra y el control 
de homónimos. 

+ La lengua natural mejora el acierto cuando se realiza sobre un resumen 

o el texto completo por la exhaustividad de su cobertura. En cambio, 

los SOC mejoran el acierto por el control de sinónimos y las relaciones 

jerárquicas y asociativas. 


La conclusión a la que se llegó es que la combinación de ambas moda- 
lidades en el mismo sistema de recuperación mejora la eficacia, porque las 
ventajas de una compensan las desventajas de la otra, es decir, la lengua natu- 
ral y los SOC son complementarios y combinados ofrecen al usuario mayores 
oportunidades de lograr una búsqueda exitosa. 

Además, otros investigadores demostraron que los usuarios finales tienen 
también sus preferencias, ya sea por la lengua natural o por los SOC (Ensor, 
1992; Fidel, 1991, 1992). 

Una nueva era se abre en el presente y hacia el futuro. Por un lado Google, 
con su algoritmo de búsqueda, ha revalorado la recuperación por lengua natural, 
mientras que la Web Semántica propuesta por el World Wide Web Consortium 
(W3C) promueve ciertos formatos comunes para los datos y la inclusión de con- 


—42-— 


tenido semántico en las páginas Web, con la idea de permitir no solo la conexión 
a través de la red, sino también la reunión de conceptos (Dextre Clarke, 2008; 
W3C, 2011). Esta propuesta de la Web Semántica abre nuevos caminos para los 
SOC y ofrece varias herramientas específicas para su gestión, como los formatos 
SKOS para desarrollar SOC en línea y OWL para las ontologías. 


Procesos de organización del conocimiento 

El Diccionario de la lengua española define proceso como “conjunto 
de fases sucesivas de un fenómeno natural o de una operación artificial” 
(Real Academia Española, 2013). Otra fuente más específica propone la 
siguiente definición: 


Secuencia de procedimientos interdependientes y vinculados que, en 
toda etapa, consume uno o más recursos (empleado, tiempo, energía, 
máquinas, dinero) para convertir entradas (datos, materiales, partes, 
etc.) en salidas. Estas salidas luego sirven de entrada para la siguiente 
etapa hasta lograr una meta conocida o un resultado final (Business 
Dictionary, 2013). 


Así, por ejemplo, el proceso de la condensación o redacción de resúme- 
nes consume recursos (condensador, computadora, electricidad, dinero) para 
transformar elementos de entrada (documento, normas, instructivos, etc.) en 
una salida o resultado —el resumen—, que a su vez puede ser la entrada de 
otro proceso como la indización y contribuir a un producto final como el re- 
gistro bibliográfico de un catálogo o de una bibliografía. 

Podemos afirmar, entonces, que los POC son aquellos procesos que po- 
sibilitan organizar el conocimiento con el fin de facilitar su recuperación. 
También nos permitimos considerar dos tipos de POC: a) los POC de la des- 
cripción de contenido y b) los POC del diseño y desarrollo de SOC. 


Procesos de organización del conocimiento de la descripción 

de contenido 

Nos referimos aquí a los procesos involucrados en la correlación concep- 
to-objeto, descripta por Dahlberg (2006a) como una de las aplicaciones de la 
organización del conocimiento. 
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En 1949, la documentalista británica Edith Ditmas describió las tareas 
que se realizan en las bibliotecas y centros de documentación como un pro- 
ceso exacto y continuo, que denominó proceso documental. Casi tres déca- 
das después, el documentalista francés Jacques Chaumier renombró a este 
proceso cadena documental, entendiendo que en realidad se trata de nume- 
rosos procesos, cada uno de los cuales constituye un eslabón concatenado 
con los demás para culminar en uno o varios productos, de modo similar 
a lo que en el ámbito industrial se conoce como una cadena productiva 
(Chaumier, 2004). 

Los procesos de la cadena documental reciben distintas designaciones 
según se trate de la bibliotecología o de la documentación y la ciencia de la 
información. 

La norma ISO 5127, referida al vocabulario de la información y la docu- 
mentación, ofrece dos definiciones de biblioteca: 


“Biblioteca 1: colección organizada de documentos seleccionados y pro- 
cesados para uso por una población destinataria predefinida. Biblioteca 
2: es un organismo o parte de un organismo en el cual se construye la 
Biblioteca 1 y se hace disponible por los servicios de su personal” (ISO, 
2001: 35). 


De modo que una biblioteca requiere, obligatoriamente, la creación de 
una colección de documentos, real o virtual, que debe ser organizada. Los 
procesos que permiten organizar la colección se denominan en nuestro me- 
dio procesos técnicos y su producto final es el catálogo de la biblioteca, que 
consiste en una “lista ordenada de un sistema de recuperación bibliográfica, 
que permite el acceso a los datos y ubicaciones de los documentos en una o 
varias colecciones” (ISO, 2001: 72). Los procesos técnicos incluyen: a) el 
desarrollo de la colección, b) la catalogación descriptiva, c) la catalogación 
de materias y d) la condensación. Los POC son los dos últimos. 

El proceso de la catalogación de materias abarca procedimientos tales 
como el análisis conceptual, la asignación de puntos de acceso verbales y 
controlados que representan el contenido del documento en un registro bi- 
bliográfico y la asignación de una signatura topográfica u otro elemento que 
remita a la ubicación física del documento. 
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El proceso de la condensación permite incluir en el registro bibliográfico 
una forma condensada como la nota de contenido o el resumen. Aunque no 
todas las bibliotecas incluyen estas formas condensadas en sus catálogos, su 
utilidad ha sido señalada por otros autores y recomendada por asociaciones 
internacionales (Dwyer, 1991; IFLA, 2011). 

Por otro lado, un centro de documentación es un “organismo que lleva a 
cabo funciones de documentación” (ISO 2001, p. 36), es decir, las funciones 
de “compilación y procesamiento continuos y sistemáticos de la información 
registrada, con el propósito de almacenamiento, clasificación, recuperación, 
utilización, o transmisión (1SO 2001: 10). También se conocen como servi- 
cios de indización y resumen. 

Un centro de documentación no necesita desarrollar una colección pro- 
pia, como es el caso de una biblioteca. Si bien se realiza una selección de los 
documentos que han de procesarse, estos no tienen que pertenecer necesaria- 
mente al centro de documentación, ni tampoco formar una colección. 

Según varios documentalistas españoles, los procesos de la cadena docu- 
mental que se llevan a cabo en un centro de documentación se dividen en dos 
grandes etapas: a) la colecta o selección de documentos y b) el tratamiento de 
la información. A su vez, el tratamiento de la información se divide en otras 
dos etapas: el análisis documental y la recuperación (López Yepes, 2004; 
Pinto Molina, 2001; Ruiz Pérez, 1992). El análisis documental es entendido 
de la siguiente manera: 


Consiste en extraer de un documento sus elementos más significativos al 
objeto de expresar su contenido de una forma distinta a la que presenta el 
original y por supuesto abreviada (Pinto Molina, 2001: 4). 


Aquella operación del proceso documental que tras un reconocimiento o 
estudio intelectual y objetivo del documento, transforma la información 
en éste contenida, ofreciéndola en productos que hacen posible su ade- 
cuada identificación, selección, recuperación y utilización por parte del 
usuario interesado, dentro de un conjunto documental más amplio (Ruiz 
Pérez, 1992: 55). 


Se reconocen dos tipos de análisis documental: el análisis documental 
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formal y el análisis documental de contenido, o simplemente análisis formal 
y análisis de contenido. El análisis de contenido incluye dos POC: la indi- 
zación y la condensación (López Yepes, 2004; Pinto Molina, 2001; Ruiz 
Pérez, 1992). 

Otros documentalistas vinculados a la Unesco usan una denominación 
distinta (Guinchat £ Menou, 1990; Wersig € Neveling, 1976). Así, se pre- 
fieren los términos descripción documental y descripción de contenido, que 
se definen como: 


Descripción de un documento que contiene todos los datos acerca de 
un documento que pueden ser de valor en un sistema de documentación 
específico; incluye por lo general la descripción bibliográfica y la des- 
cripción de contenido que surge del análisis documental, la condensación 
y la indización (Wersig €: Neveling, 1976, p. 98). 


Se llama descripción de contenido (DC) por analogía con la expresión 
“descripción bibliográfica” (DB), al conjunto de operaciones mediante 
las cuales se describe aquello de que trata un documento o un asunto 
(hecho, conceptos, números, imágenes, etc.) y los productos resultantes. 
Estas operaciones y productos se denominan comúnmente clasificación, 
indización, condensación y análisis (Guinchat €1 Menou, 1990: 121). 


De modo que la descripción documental abarca la descripción biblio- 
gráfica y la descripción de contenido, y esta última incluye varios POC: la 
clasificación, la indización y la condensación. 

El producto final por excelencia de un centro de documentación es una 
bibliografía especializada, que se define como un “sistema de recuperación 
bibliográfica que permite el acceso a los datos que describen e identifican 
documentos” (ISO, 2001: 72). 

Ahora bien, ciertas bibliotecas —como las nacionales y algunas especia- 
lizadas— también producen bibliografías y por lo tanto es correcto referirse 
al proceso de indización en bibliotecas. 

En este sentido, algunos autores consideran que la catalogación y la in- 
dización son lo mismo y han establecido un paralelismo entre ambas. De este 
modo, se refieren a una indización descriptiva y una indización de materias 
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(Ajorland, 2007b; IFLA, 2011; Lancaster, 1995). También hay discrepancias 
en cuanto a considerar el proceso de clasificación como una forma de indi- 
zación (IFLA, 2011; ISO, 2001; Lancaster, 2002), la indización como una 
forma de clasificación (Cleveland €: Cleveland, 2013; Naumis Peña, 2003) 
O la indización y la clasificación como procesos distintos (Dahlberg, 2006a; 
Tudhope et al., 2006). Aquí no profundizaremos en esta polémica. 

Por otro lado, se reconocen dos tipos de indización (Foskett, 1996): 

+ La indización derivada que surge de la extracción automática de pa- 

labras claves del título, el resumen o el texto completo del documento. 

También se conoce como indización automática. 

* La indización asignada que consiste justamente en la asignación, por un 

indizador, de un epígrafe, un término preferente o una notación. 


A su vez, la indización puede ser precoordinada o poscoordinada. Es 
precoordinada cuando los conceptos son coordinados por el indizador en la 
etapa de almacenamiento. Por el contrario, la indización es poscoordinada 
cuando los conceptos son coordinados por el usuario final en la etapa de 
recuperación. El tesauro es un SOC que se aplica al proceso de la indización 
asignada y poscoordinada. 

Los procesos anteriores, de una u otra manera, también se cumplen en 
otros sistemas de recuperación, por ejemplo en los sitios Web, donde los con- 
tenidos pueden indizarse y condensarse mediante registros metadatos que 
facilitan la recuperación. 


Procesos de organización del conocimiento para el diseño 

y desarrollo de SOC 

Son aquellos procesos que tienen que ver con lo que Dahlberg (2006a) 
denomina construcción de sistemas de conceptos. Incluyen, entre otros, la 
definición y análisis del dominio, el control del vocabulario, la determina- 
ción de las relaciones semánticas o de otra índole, la construcción del orden 
sistemático, la publicación, la evaluación y actualización continua del SOC. 
Se explicarán con mayor detalle en capítulos posteriores, aplicados al diseño 
y desarrollo del tesauro. 
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Autoevaluación 


¿En qué categorías incluyen al tesauro los autores Hodge, Tudhope et al., 
Zeng y Souza et al.? 


¿Cuáles son las diferencias y semejanzas que muestran las herramientas se- 
mánticas mencionadas por Hjagrland? 


¿Cómo define sistema de organización del conocimiento? 
¿Qué ventajas y desventajas tienen para la recuperación, respectivamente, el 
uso de la lengua natural y el uso de un sistema de organización del conoci- 


miento como el tesauro? 


¿Por qué la lengua natural y los sistemas de organización del conocimiento se 
complementan en la etapa de recuperación? 


¿Qué procesos de organización del conocimiento de la cadena documental se 
llevan a cabo, generalmente, en una biblioteca? 


¿Qué procesos de organización del conocimiento de la cadena documental se 
llevan a cabo, generalmente, en un centro de documentación? 
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3. Distintos enfoques para estudiar los SOC 


En el capítulo 2 hicimos referencia a la diversidad terminológica em- 
pleada para designar a los SOC. En parte, tal situación se debe a que estos 
han sido estudiados desde distintos puntos de vista. A continuación anali- 
zaremos los SOC de acuerdo con tres enfoques: lingúístico, terminológico 
y bibliotecológico. 


Enfoque lingúístico 

La lingúíística documental, muy difundida en las últimas décadas del si- 
glo veinte, propone apropiarse de la teoría lingiística particularmente de la 
corriente estructuralista para fundamentar el diseño y aplicación de los SOC, 
que bajo este enfoque han sido designados lenguajes documentales. García 
Gutiérrez lo explica de la siguiente manera: 


La denominación “lingúística documental” surge en el momento en que 
los elementos que intervienen en el proceso comunicativo-documental 
exceden su tradicional naturaleza lógica y mecanicista y son descritos, 
se transforman y organizan, al menos esa es nuestra propuesta, como 
elementos de comportamiento fundamentalmente lingúístico mantenien- 
do y potenciando sus objetivos habituales [...] Se pretende demostrar, 
en realidad, que la exaltación del mensaje, de la comunicación, de los 
signos, de la estructura y de los enunciados en Documentación sugiere 
un mayor aprovechamiento de la Teoría Lingúística como fundamento 
de los métodos y procesos documentales (García Gutiérrez, 1990: 11). 


La profesora cubana Dolores Vizcaya Alonso adhiere a esta posición y de 


cierta manera enfatiza el vínculo con la corriente estructuralista iniciada por 
Ferdinand de Saussure: 
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Todo lo que sobre lenguajes documentarios se estudie, se tendrá que ha- 
cer, de una forma u otra, dentro del campo de la lingúística; y cuando 
de esta disciplina se trata, no se puede comenzar a escribir nada sin de- 
dicarle las primeras líneas a quien tan merecidamente fuera llamado el 
padre de la lingiística moderna: Ferdinand de Saussure (Vizcaya Alonso, 
1997: 15). 


Así como el objeto de estudio de la lingúística es la lengua natural, el 
objeto de estudio de la lingúística documental es el lenguaje documental, es 
decir los SOC. 

Dentro de este enfoque haremos algunas precisiones. En primer lugar, 
podemos distinguir entre lenguaje y lengua. El lenguaje es una capacidad 
abstracta y general de comunicación. Existen diversas formas de comunica- 
ción humanas y no humanas que constituyen un lenguaje, pero no una lengua 
en sentido estricto; por ejemplo, el lenguaje corporal humano o el lenguaje de 
las abejas. En cambio la lengua, si bien es un tipo de lenguaje, es un sistema 
concreto y particular de signos que forman un léxico o vocabulario, una se- 
mántica y una sintaxis (ISO, 2001; Lyons, 1997; Naumis Peña, 2008). 

Es importante aclarar que el inglés, un idioma que ejerce fuerte influen- 
cia sobre la terminología tanto de la lingiística como de la BDCI, posee un 
solo vocablo language para expresar tanto el concepto de lenguaje como el 
de lengua. Por el contrario, otras lenguas tienen un vocablo diferente para 
cada concepto: en francés langage y langue, en italiano linguaggio y lingua, 
en portugués linguagem y língua, en español lenguaje y lengua (1SO, 2001; 
Lyons, 1984; Naumis Peña, 2008). La traducción del inglés a estos últimos 
idiomas hizo que se acuñaran en la BDCI los términos lenguaje natural, len- 
guaje artificial, lenguaje de indización, lenguaje de descriptores, lenguaje 
documental o lenguaje documentario, es decir que se usara lenguaje en lugar 
de lengua. Aquí utilizaremos lengua natural para referirnos al objeto de estu- 
dio de la lingúística, pero debido a su uso generalizado aceptaremos lenguaje 
documental, lenguaje documentario, lenguaje de indización y otros términos 
similares usados en la BDCL, entendiendo que se trata de lenguas, en este 
caso artificiales. 

Ahora es preciso distinguir entre lengua natural y lengua artificial. La 
lengua natural es aquella hablada por una comunidad lingúística particular. El 
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francés, el ruso, el mandarín, el swahili, el guaraní o el quekchí son ejemplos 
de lenguas naturales. En la actualidad, se hablan miles de lenguas naturales en 
todo el mundo y se conocen también numerosas lenguas muertas o extintas. 

Una lengua natural tiene variadas funciones, ya que con ella se puede 
redactar un informe técnico, narrar una historia cierta o ficticia, dar una or- 
den, discutir un asunto, influir sobre otras personas, componer un poema o 
establecer contacto con otros mediante un simple hola. Además, la lengua 
natural posee un léxico plurisemántico y su sintaxis se establece con el uso. 

Por el contrario, las llamadas lenguas artificiales, entre las que se encuen- 
tran los lenguajes documentales, tienen una única función, su vocabulario 
es unívoco y su sintaxis se establece con anterioridad al uso. Entonces, los 
lenguajes documentales o SOC son lenguas artificiales, cuya principal fun- 
ción es organizar el conocimiento socializado y registrado para que pueda ser 
recuperado. Además, acorde con lo que señala Svenonius (2003), los SOC 
como lenguas artificiales constan también de un léxico o vocabulario, una 
semántica y una sintaxis. 

El léxico o vocabulario es el conjunto finito de los signos de una len- 
gua, ya sea en general o pertenecientes al uso de una región, una actividad 
determinada, un campo semántico dado, una persona o un grupo de personas 
(Barité et al., 2013; ISO, 2001; López Yepes, 2004; Real Academia Española, 
2011; Wersig € Neveling, 1976). 

El vocabulario de un SOC es por lo tanto el conjunto de signos que han 
sido aceptados para su aplicación en los procesos de organización del conoci- 
miento. Al igual que en la lengua natural, los signos de un SOC constan de 
significado (imagen mental) y de significante (imagen acústica o, en el caso 
de los SOC, imagen gráfica) y la relación entre significado y significante 
es arbitraria. 

Los signos de un SOC pueden tomarse de la lengua natural, como sucede 
en las listas de epígrafes y en los tesauros, o de otro tipo de sistema, como 
es el caso de las notaciones de un sistema de clasificación, para las cuales se 
utilizan números, letras o una combinación de ambos. En todos los casos y 
en virtud de un artificio que se conoce como control del vocabulario, cada 
signo del SOC es despojado de todos sus significados menos uno y de todos 
sus significantes menos uno, de modo que la totalidad de los signos resultan 
unívocos, eliminándose así la sinonimia y la homonimia que caracterizan la 
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lengua natural, pero que presentan tantos problemas para la recuperación. 
La profesora estadounidense Marcia Bates (1988) señala que el control 
del vocabulario también incluye las reglas para formalizar el significante 
(forma gramatical, género y número, estructura del sintagma) y los británi- 
cos Aitchison et al. (2000) afirman que el control del vocabulario consta de 
cuatro fases: 
* Control del significante: elección de un solo significante, su forma gra- 
matical, ortografía, género y número, etc. 
* Control de sinónimos: selección de solo uno de los sinónimos disponi- 
bles para expresar un concepto. 
+ Control de signos especiales: selección de términos prestados, jergas, 
nombres comerciales y nombres propios. 
+ Control del significado o desambiguación: elección de un solo signi- 
ficado, que debe ser el más efectivo para los propósitos del SOC. Esta 
restricción se logra mediante calificadores, notas de definición y notas de 
alcance, como se verá más adelante en el capítulo 7. 


El producto del control del vocabulario es un vocabulario controlado, 
que definimos como el conjunto restringido de signos de un SOC autoriza- 
dos para uso en los POC de descripción de contenido (ISO, 2001; López 
Yepes, 2004). 

Algunos autores consideran que vocabulario controlado es un sinónimo 
de lenguaje documental o de SOC y, por lo tanto, se afirma que los tesauros, 
las listas de epígrafes y los sistemas de clasificación son vocabularios con- 
trolados (ISO, 2011; Lancaster, 2002; NISO, 2010). Nosotros no estamos de 
acuerdo con esto porque consideramos que el vocabulario controlado es un 
componente del SOC, junto con la semántica y la sintaxis. 

La semántica es “la rama de la Lingúística que se ocupa del sentido o 
el significado de los signos, así como de la relación entre los mismos, tanto 
desde un punto de vista sincrónico como diacrónico” (Barité et al., 2013). En 
un SOC, la semántica se evidencia en la “red de significados que se establece 
en un sistema de organización del conocimiento, entre los distintos términos 
que forman su estructura” (Barité et al., 2013). En un tesauro, esta red de sig- 
nificados se explicita en las relaciones de equivalencia, jerarquía y asociación 
(Hjorland, 2007a,b; ISO, 2001; Svenonius, 2003; Wersig € Neveling, 1976). 
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Finalmente, la sintaxis es la “disciplina que se ocupa del estudio de la 
estructura gramatical de la lengua, y de las reglas que gobiernan la construc- 
ción de frases o sentencias que forman el discurso, así como de la relación 
entre las palabras que las forman” (Barité et al., 2013). En un SOC, la sintaxis 
es el “conjunto de reglas utilizadas para combinar descriptores o símbolos 
de clasificación, de modo tal que expresen una secuencia lógica” (Barité 
et al., 2013). En este último sentido, la sintaxis de los SOC puede ser pre- 
coordinada o poscoordinada (Foskett, 1996; Svenonious, 2003; Wersig €z 
Neveling, 1976). 

Barité et al. ofrecen dos acepciones para el término precoordinación: 


a. “Procedimiento de combinación de dos o más términos o símbolos 
notacionales incorporado originalmente en un lenguaje documental” 
(Barité et al., 2013). En este caso, el signo del SOC puede ser una 
frase que combine los conceptos que se desea representar (Miller €z 
Teitelbaum, 2002). Ejemplos de este tipo de precoordinación son los 
siguientes epígrafes de LEMB: 


comunicación en administración de bibliotecas 
conservación y restauración de libros 
programas nacionales para adquisición y catalogación 


b. “Combinación de términos o símbolos que realiza el indizador 
o el clasificador considerando las temáticas involucradas en el do- 
cumento que está procesando” (Barité et al., 2013). En este caso se 
debe construir una cadena precoordinada cuyos componentes deben 
seguir un orden de mención preestablecido (Miller €: Teitelbaum, 
2002). Los siguientes epígrafes de LEMB y notaciones de CDU son 
ejemplo de cadenas precoordinadas: 


bibliotecarios-ética profesional 
bibliotecas-historia-hasta 400 d.C. 
bibliotecología-historia-Argentina-1810-1902 
004:023 

026(82)”20” 
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Las listas de epígrafes como LCSH, LEMB, Sears o ARMARC y los 
sistemas de clasificación como SCDD y CDU son precoordinados. 

Por otro lado, también Barité et al. (2013) definen poscoordinación como 
“procedimiento de libre combinación de términos o descriptores al momen- 
to en que se define la ecuación de búsqueda”. En este caso, los términos se 
almacenan en cualquier orden y es el usuario final quien los coordina en 
su estrategia de búsqueda (Miller €: Teitelbaum, 2002). Los siguientes son 
ejemplos tomados del Tesauro Spines: 


economía 
economía humana 
economía de mercado 


Así, los tesauros son los SOC apropiados para la indización poscoordinada. 


Enfoque terminológico 

Como se verá en capítulos posteriores, este enfoque terminológico es de 
primordial relevancia para el diseño y desarrollo de un tesauro. 

Comenzaremos por aclarar que la palabra terminología puede entenderse 
en dos sentidos. Por un lado, la terminología (con minúscula) es el conjunto 
de términos especializados propios de una disciplina o un campo de conoci- 
miento. De este modo, es común referirse a la terminología médica, la termi- 
nología informática, la terminología jurídica, etc. También se conoce como 
lengua de especialidad. 

Por otro lado, la Terminología (con mayúscula) es la disciplina o el cam- 
po multidisciplinario que estudia las unidades terminológicas y los productos 
terminológicos (glosarios, diccionarios, etc.) y propone una teoría sobre ellos. 

Quienes estudian los SOC desde el punto de vista de la Terminología, 
lo hacen generalmente sobre la base de la tríada objeto-concepto-desig- 
nación, que resulta de especial utilidad cuando se aplica al diseño de un 
tesauro (Figura 1). 

La norma ISO 25964 para el diseño y desarrollo de tesauros afirma que 
un término es “una palabra o frase usada para etiquetar un concepto”; a su 
vez, define concepto como “unidad de pensamiento” (ISO, 2011: 3, 12). Si 
bien estas afirmaciones son correctas, llama la atención la escasa y superficial 
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información que ofrece la norma tanto de concepto como de término, sobre 
todo porque esta distinción es indispensable para comprender el modelo de 
datos recomendado por la norma, que se describe en el capítulo 12 de la 
presente obra. 


Figura 1. Triángulo del concepto. El concepto es la representación mental 
de un objeto y se expresa mediante una designación que denota al objeto 


Objeto 





Concepto ——————=> Designación 


Barité afirma que los profesionales de la BDCI hemos sido extremada- 
mente descuidados en el estudio de los conceptos, tendiendo a “trabajar ape- 
nas con las etiquetas o 'fachadas' de los conceptos, sin considerar los aspectos 
relativos a la construcción y definición de los mismos” (Barité, 2000a: 31). 

Debido a la importancia que esto tiene para el diseño de un tesauro, re- 
curriremos a otra fuente para explicarlo con mayor detalle: nos referimos a 
la norma ISO 704:2009 sobre principios y métodos del trabajo terminológico 
(ISO, 2009). Esta norma terminológica tiene numerosos puntos en común 
con las normas para el diseño de tesauros, pero ofrece precisiones que no se 
encuentran en estas últimas. 


Objeto 
Para la norma ISO 704:2009, un objeto es cualquier cosa que un ser hu- 
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mano pueda percibir o concebir. Dahlberg (1978) lo llama referente. 

El objeto puede ser concreto o material, como un edificio, una silla, un 
libro, un niño, un bosque. También puede ser abstracto o inmaterial, como la 
felicidad, la tristeza, el pensamiento, las ideologías, las acciones. Por último, 
el objeto puede ser imaginario como una sirena, un centauro, Hamlet, la Ho- 
gwarts School o Macondo. 

Todos los objetos tienen una o más propiedades que los caracterizan y 
permiten comprenderlos y aprehenderlos. 


Concepto 

Un concepto es la representación mental de un objeto. A través de la 
observación y de un proceso de abstracción llamado conceptualización, un 
objeto del mundo real o del mundo ideal es categorizado como una unidad 
de conocimiento que es precisamente el concepto (ISO, 2009). Otros autores 
lo llaman noción (Barité, 2000a), pero aquí usamos concepto, siguiendo la 
citada norma ISO 704:2009. 

Barité (2000b: 40) identifica los siguientes rasgos definitorios de 
concepto: 


a. Todo concepto es una construcción abstracta, que utiliza el lenguaje 
como vía para representar (o sea, volver a presentar) de un modo com- 
prensible o inteligible, un objeto o un fenómeno de la realidad (presente, 
pasada o incluso futura) o del reino de lo ideal. 

b. Todo concepto o noción corresponde a la expresión de una unidad 
aislable, autónoma de pensamiento. Es, para decirlo de otra manera, una 
parte significativa de la realidad material o ideal sobre la cual la reflexión 
humana ejerce una segmentación o delimitación convencional [...]. 

c. Asimismo, y por consecuencia, cada concepto o noción se constituye 
en una unidad mínima y autosuficiente de conocimiento. 

d. La construcción de un concepto implica necesariamente su definición, 
usualmente por medio de claves de lenguaje [...]. 

e. Desde una óptica terminológica, todavía es posible agregar un quinto 
rasgo o atributo de las nociones, y es que cada una de ellas, en cuanto 
unidad orgánica de conocimiento, se inserta necesariamente en una rama, 
una parte, una disciplina, en suma, del saber especializado. No cabe ha- 
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blar de conceptos en Terminología sin el marco referencial de una disci- 
plina (científica, técnica) o de una especialidad, y del sistema de concep- 
tos que la representa. Ausente ese marco, solo encontramos palabras de 
la lengua general con sus significados, pero no conceptos especializados, 
pues los conceptos son en última instancia, unidades cognitivas que ad- 
quieren su significación plena solo en el contexto de un sistema nocional 
disciplinario. 


Un concepto puede ser general o individual (1SO, 2009). Es un concepto 
general cuando representa a un conjunto de objetos que comparten propie- 
dades comunes, por ejemplo: “organismos internacionales”, “universidades”, 
“países americanos”, “naves espaciales”. En cambio, es un concepto indivi- 
dual cuando representa un objeto único, distinto de todos los demás y que 
constituye una unidad inconfundible, por ejemplo: “Organización de las Na- 
ciones Unidas”, “Universidad de Buenos Aires”, “Paraguay”, “Apolo 11”. 

El concepto, ya sea general o individual, se construye a partir de las ca- 
racterísticas que predican o declaran las propiedades del objeto. Cada propie- 
dad del objeto se abstrae como una característica del concepto. Entonces, un 
concepto es la abstracción de un objeto y una característica es la abstracción 
de una propiedad del objeto. 

Las características pueden ser, básicamente, de dos tipos: 
* Características esenciales: son aquellas características necesarias y su- 
ficientes para determinar un concepto y son imprescindibles para definir 
el objeto sin ambigúedad. Por ejemplo, el concepto “caballo” tiene, entre 
otras, las siguientes características esenciales: es un mamífero periso- 
dáctilo, pertenece al género equus, especie ferus, subespecie caballus, 
es herbívoro. 

+ Características accidentales: son aquellas características adicionales o 

posibles que solo se pueden generalizar respecto a una parte del objeto o 

a ciertos tipos de objetos. Siguiendo con el ejemplo del concepto *caba- 

llo”, las siguientes serían características accidentales: es un alazán, posee 

una marca blanca en la cara de tipo lucero, tiene calcetines blancos en 
tres patas, compite en deportes ecuestres. 


El conocimiento de las características del concepto hace posible: a) cons- 
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truir el concepto, b) definir el concepto, c) establecer las relaciones entre los 
conceptos y d) modelar un sistema de conceptos (Dahlberg, 1978). 

Dado que las características y los conceptos son representaciones menta- 
les o abstracciones, para comunicarlos es necesario recurrir a la lengua. Así, 
una característica se expresa mediante un enunciado y un concepto se expresa 
por medio de una definición o de una designación. 


Definición 
De acuerdo con Barité et al., una definición es: 


Conjunto de enunciados que describen un objeto (cosa, ser, fenómeno, 
entidad), en un nivel de abstracción dado, con la finalidad de establecer 
su identidad, y diferenciarlo inequívocamente de otros objetos. La defi- 
nición de un término es un presupuesto básico para la comunicación, el 
intercambio en uno o varios idiomas y la argumentación, y constituye 
un elemento insustituible en la construcción del pensamiento científico. 
Debe cumplir, entre otros, los siguientes requisitos: precisión, concisión, 
claridad, autosuficiencia y un nivel de exhaustividad adecuado a los des- 
tinatarios (Barité et al., 2013). 


La definición establece los límites del concepto, hace posible su com- 
prensión y lo distingue de otros conceptos. El conjunto de características que 
forma el concepto se denomina la intensión del concepto. El conjunto de 
objetos conceptualizados como un concepto se conoce como la extensión del 
concepto (ISO, 2009). Entonces, se puede establecer una definición por in- 
tensión o una definición por extensión. Por ejemplo: 

* Definición por intensión de caballo: mamífero, herbívoro, perisodáctilo 

del género Equus, especie ferus, subespecie caballus. Posee cuello y cola 

poblados de cerdas largas y abundantes; domesticado desde hace unos 

5500 años. En general es de gran porte, aunque varía en tamaño, pelaje, 

marcas y actividades a las que se destina. 

+ Definición por extensión de caballo: el caballo puede ser árabe, an- 

glo árabe, criollo argentino, connemara, hannoveriano, poni australiano, 

holstein, poni camargue, appaloosa, haflinger, poni dartmoor, jaca gale- 
sa, andaluz, de silla, poni new forst, lipizzano, de tiro holandés [...]. 
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La norma ISO 704:2009 considera que el tipo de definición más conve- 
niente en el área de la Terminología es la llamada definición por intensión. 
Este tipo de definición se compone de un concepto superordenado, que ubica 
el concepto en su contexto, seguido por las características que lo delimitan. 
Como señala Barité (2000a), el principio involucrado en la definición por in- 
tensión es el de género próximo y diferencia específica, que ha sido también 
señalado por otros autores para las definiciones en los tesauros y otros SOC 
(Aguado et al., 1999; Hudon, 1996; Vickery, 1960a). 

A continuación se presentan tres ejemplos de definición por intensión: 


caballo 

DEF mamífero del orden de los Perisodáctilos, solípedo, del género 
Equus, especie ferus, subespecie caballus. Es herbívoro, de cuello y cola 
poblados de cerdas largas y abundantes; domesticado desde hace unos 
5500 años. Suele ser de gran porte, aunque varía en tamaño, pelaje, mar- 
cas y actividades a las que se destina. 


caballo deportivo 
DEF caballo que se destina a la práctica de los deportes ecuestres como 
el salto de obstáculos, la hípica, el polo, la doma, etc. 


Secretariat 

DEF caballo deportivo que se destacó en la hípica. Nació en Estados 
Unidos el 30 de marzo de 1970 y murió el 4 de octubre de 1989. Hijo 
de Bold Ruller en la yegua Somethingroval. Propiedad del stud Mea- 
dow Stable de Penny (Chenery) Tweedy. Participó en 21 carreras con una 
marca de 21-16-3-1. En 1973 ganó la Triple Corona y los tres años que 
corrió, 1972, 1973 y 1974 fue designado Caballo del Año. 


El primer concepto (caballo) es el más general, mientras que el último 
(Secretariat) es el más específico. El género próximo se hereda de una defini- 
ción a otra: caballo deportivo hereda el género caballo, mientras que Secretariat 
hereda el género caballo deportivo. Esta cualidad de heredar el género próximo 
resulta muy útil en un tesauro para establecer las relaciones jerárquicas, que a 
veces se designan como relaciones padre-hijo. Por ejemplo, de las tres defini- 
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ciones anteriores se puede determinar la relación jerárquica entre los conceptos: 
caballo 
caballo deportivo 
Secretariat 


Designación 

La designación es la expresión de un concepto por medios verbales o 
simbólicos. Así, la moneda argentina puede designarse por medio del término 
pesos o del símbolo $, mientras que el símbolo registrado legalmente para 
identificar de manera exclusiva uno o varios productos comerciales se puede 
designar con el término marca registrada o con el símbolo E. 

Entre las designaciones verbales se puede hacer una distinción entre tér- 
mino y nombre propio. Un concepto general se designa mediante un término, 
mientras que un concepto individual se designa mediante un nombre pro- 
pio. Volviendo al ejemplo del apartado anterior, caballo y caballo deportivo 
son términos que designan conceptos generales. En cambio Secretariat es un 
nombre propio que designa un concepto individual. 

En la lengua natural, un concepto puede ser expresado por una o varias 
designaciones (sinonimia). A su vez una designación puede expresar uno o 
varios conceptos (homonimia). Por el contrario, en un SOC cada concepto 
debe expresarse por una y solo una designación e inversamente cada designa- 
ción debe expresar uno y solo un concepto. Según el tipo de SOC, la designa- 
ción puede ser, por ejemplo, un epígrafe, una notación, un término preferente, 
o una forma autorizada del nombre. 


Relaciones semánticas y sistemas de conceptos 

Cada concepto es una unidad de conocimiento, pero no es una unidad 
aislada, sino que mantiene relaciones semánticas con otros conceptos. Estas 
relaciones permiten construir una estructura que constituye un sistema de 
conceptos, definido como “un conjunto de conceptos estructurado de acuerdo 
con las relaciones entre ellos” (ISO, 2009: 8). 

Un SOC, en cuanto sistema de conceptos, debe definir los conceptos, de- 
signarlos en forma unívoca, relacionarlos por su semántica y organizarlos en un 
orden determinado. En el tesauro, las relaciones semánticas son de tres tipos: 

+ Relación de equivalencia: se establece entre un término o un nombre 
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propio elegidos para la indización y sus sinónimos o formas variantes. 

+ Relación jerárquica: se establece entre un concepto que representa un 
género o un todo y otro que representa una especie, una parte, o un ejem- 
plo del anterior. 

+ Relación asociativa: se establece entre dos conceptos, que no pueden 
considerarse ni equivalentes, ni jerárquicos. 


3.3 Enfoque bibliotecológico 

Los Functional requirements for subject authority data (FRSAD) son 
parte del nuevo modelo conceptual que ha propuesto IFLA para las bases de 
datos bibliográficas y de autoridades, que se integra en la llamada familia 
FRBR con los requisitos funcionales para registros bibliográficos (FRBR) 
y los requisitos funcionales para datos de autoridad de nombres propios 
(FRAD) (FLA, 2004, 2009b, 2010). 

Originalmente, el modelo FRBR definió tres grupos de entidades según 
se muestra en la Tabla 1. Sin embargo, desde el primer momento se notó que 
las entidades del Grupo 3 no eran del todo correctas, ya que —como hemos 
visto— un concepto representa un objeto y este a su vez puede ser cualquiera 
de las entidades de los grupos 1, 2, 3 u otras más. De modo que para no alterar 
el modelo, los responsables de FRSAD se vieron obligados a postular dos 
superclases que responden a los términos en latín thema y nomen. 


Tabla 1. Entidades del modelo FRBR-FRAD-FRSAD 


Obra 
Expresión 
Manifestación 
Ítem 


1 FRBR 








Persona 
2 FRAD Familia 
Entidad corporativa 


Thema 
Nomen 














Concepto 
Objeto 
Acontecimiento 
Lugar 


3FRSAD 
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Thema (en plural themata o themas) es cualquier entidad usada como 
materia de una obra. Una obra puede tener como materia uno o varios the- 
mas y, a su vez, un thema puede ser materia de una o varias obras, según se 


muestra en la Figura 2. 


Figura 2. Relación obra-thema. Nótese la doble flecha que relaciona estas 
entidades: una obra puede tener uno o más themas como materia y un thema 
puede ser materia de una o más obras. 


tiene materia 
Obra E es materia de Ñ Thema | 


Por otra parte, nomen (en plural nomina o nomens) es cualquier signo 
o secuencia de signos por los que se conoce, refiere o dirige un thema. Por 
ejemplo, el thema $ puede tener como nomens anteojos, espejuelos, gafas o 
la notación de CDU 617.7-089.24. 





Figura 3. Relación thema-nomen. A) En la lengua natural la flecha es doble en 
ambas direcciones, pues un thema puede tener uno o más nomens y a la inversa, 
un nomen puede designar uno o más themas. B) En un SOC la flecha es doble 
en un sentido y simple en el otro, porque un thema puede tener uno o más no- 
mens (solo uno preferente), pero un nomen puede designar un solo thema. 


tiene designación 
A EN: designación de ME 
a tiene designación 
MIME es designación de * 


La relación entre thema y nomen se esquematiza en la Figura 3. Como se 
puede observar, en la lengua natural, un thema puede ser designado por uno o 
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varios nomens (sinonimia) y a su vez un nomen puede designar uno o varios 
themas (homonimia). Al contrario, en un SOC un thema puede ser designado 
por uno o varios nomens (uno preferente y otros equivalentes o no preferen- 
tes), pero un nomen solo puede designar un thema. 

Este enfoque bibliotecológico permite generalizar el asunto o materia 
más allá de las diferencias que existen entre los distintos SOC. Así, por ejem- 
plo, el thema en un tesauro siempre es un concepto y, por lo tanto, el enfoque 
terminológico se ajusta perfectamente. En cambio en los SOC precoordina- 
dos, el thema puede ser un concepto o una combinación de conceptos. 

El nomen en un tesauro puede ser un término preferente, un término no 
preferente, una forma autorizada del nombre o una forma variante del nom- 
bre, como se detalla en el capítulo 7. 

En una lista de epígrafes el nomen puede ser un epígrafe, una forma auto- 
rizada del nombre, una cadena precoordinada o las formas variantes de todos 
estos. De forma similar, en un sistema de clasificación el nomen puede ser 
una notación o una cadena precoordinada de notaciones, así como los equiva- 
lentes verbales de estas. Por ejemplo, observemos los siguientes nomens de la 
lista de epígrafes ARMARC y del sistema de clasificación CDU: 


iglesia y problemas sociales 

enciclopedias y diccionarios para niños 
oceanografía-aparatos e instrumentos 

331.2 Salarios. Sueldos. Remuneraciones. Pagos 
37:61(82) Enseñanza de la medicina en Argentina 
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Autoevaluación 


¿Cuáles son los distintos enfoques con que se han estudiado los SOC? 


Explique la diferencia entre lengua natural y lengua artificial. 


¿Qué características posee el vocabulario de un SOC? 


Indique cómo se evidencian la semántica y la sintaxis en un SOC. 


Explique la tríada objeto-concepto-designación. 


¿Qué tipo de definición se recomienda para un tesauro? 


¿Qué designación verbal le corresponde a un concepto general? 


¿Qué designación verbal le corresponde a un concepto individual? 


¿Qué significado tienen los términos thema y nomen? 


Explique las relaciones entre obra y thema y entre thema y nomen. 


Mencione las relaciones thema-thema y nomen-nomen. 
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4. El tesauro 


En los capítulos anteriores hemos establecido un marco de referencia ge- 
neral. Ahora nos introduciremos específicamente en el tema del tesauro. Lo 
definiremos y caracterizaremos, analizando también su función y su tipología. 


Definición y caracterización del tesauro 

En el capítulo 2 se estableció que el tesauro es un SOC y que diversos 
especialistas lo han clasificado en distintas categorías: es una lista de relacio- 
nes (Hodge, 2000), un SOC basado en relaciones (Tudhope et al., 2006), un 
modelo de relaciones (Zeng, 2008), una estructura de conceptos y relaciones 
(Souza et al., 2010; 2012), o una herramienta semántica (Broughton et al., 
2005; Hjorland, 2007a). Estas categorías resaltan principalmente las relacio- 
nes entre los conceptos del tesauro. 

También establecimos en el capítulo 3 que los SOC, en cuanto lenguas 
artificiales, constan de un vocabulario, una semántica y una sintaxis (Sveno- 
nius, 2003). Explicamos además la tríada objeto-concepto-designación, de 
importancia crítica para el tesauro (Barité, 2000a; ISO, 2009). 

Sobre esta base y teniendo en cuenta las numerosas definiciones de te- 
sauro que aparecen en la bibliografía, nos permitimos establecer nuestra pro- 
pia definición como marco de referencia para esta obra: 

+ Un tesauro es un sistema de organización del conocimiento. 

+ Se compone de: a) un vocabulario controlado, b) una estructura de re- 

laciones semánticas explícitas de equivalencia, jerarquía y asociación, 

c) un orden sistemático que evidencia el sistema de conceptos de un 

dominio, d) una sintaxis poscoordinada y e) una cobertura limitada a 

un dominio determinado. 

» Se aplica a la organización y recuperación del conocimiento registrado 

en bases de datos bibliográficas, bibliotecas virtuales, portales Web, etc. 
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Como todos los SOC, un tesauro impone una cierta concepción del mun- 
do, de acuerdo con el dominio que trata, los usuarios a los que está dirigido, 
la lengua en que se elabora, la cultura de una región, país, grupo étnico u 
organismo del que procede. 


Componentes del tesauro 
Hemos mencionado en nuestra definición los componentes del tesauro. A 
continuación explicaremos brevemente cada uno de ellos. 


El vocabulario controlado 

El tesauro, en cuanto SOC, consta de un vocabulario controlado formado 
por un conjunto de términos y nombres propios que designan, respectiva- 
mente, conceptos generales e individuales. En el vocabulario de un tesauro 
se elimina toda sinonimia y homonimia, con el fin de aportar consistencia a 
la recuperación. 

Si bien las normas y los manuales para el diseño y desarrollo de tesauros 
incluyen recomendaciones respecto a la redacción de los términos y nombres 
propios según se detalla en el capítulo 7 de esta obra, es importante tener en 
cuenta que el elemento esencial del vocabulario de un tesauro es el concepto 
y no el término o el nombre que lo designa, ya que estos últimos pueden va- 
riar, pero no el concepto que debe definirse con precisión. 


Las relaciones del tesauro 

Los conceptos incluidos en un tesauro se vinculan semánticamente entre 
sí mediante relaciones de equivalencia, jerarquía y asociación. 

La relación de equivalencia es la que se establece entre un término que ha 
sido seleccionado para el tesauro y los sinónimos que han sido descartados, 
o bien entre una forma aceptada del nombre propio y las variantes que este 
pudiera tener. 

La relación jerárquica se establece entre un concepto que representa el 
género o el todo y otro que representa una especie, una parte o un ejemplo 
del anterior. 

La relación asociativa es aquella que se establece entre dos conceptos, 
pero que no es ni equivalente ni jerárquica. 

Un tesauro debe presentar las tres relaciones de modo explícito y recípro- 
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co; si carece de alguna de ellas no es un tesauro. Estas relaciones se describen 
con detalle en los capítulos 7 y 8. 


Orden sistemático 

Los conceptos del tesauro se ordenan formando un orden sistemático o 
clasificado. El orden sistemático es una característica del tesauro que hace 
evidente el sistema de conceptos del dominio y sitúa cada concepto en ese 
contexto, de modo similar al esquema de un sistema de clasificación. 

La norma ISO 25964 recomienda tres posibles formas de construir el 
orden sistemático: a) por disciplinas o campos temáticos, b) por facetas y C) 
por facetas bajo disciplinas o campos temáticos. Se describen en el capítulo 
9 de la presente obra. 


Sintaxis poscoordinada 

El tesauro es un SOC desarrollado especialmente para la indización pos- 
coordinada, es decir, los términos y los nombres propios se almacenan en el 
registro bibliográfico o metadatos sin un orden de cita o de mención predefi- 
nido y son coordinados por el usuario en el momento de la recuperación. Esta 
característica también establece una diferencia entre el tesauro y las listas de 
epígrafes que son precoordinadas. 


El dominio del tesauro 

En general, se considera que el tesauro es un tipo de SOC limitado a 
una cierta especialidad, campo temático o dominio, distinto de otros SOC 
que procuran abarcar la universalidad del conocimiento. En efecto, el tesauro 
nació con el propósito de resolver problemas de recuperación en áreas espe- 
cíficas de la ciencia y la tecnología y, hasta ahora, los numerosos tesauros 
elaborados son especializados. 

Sin embargo, no podemos evitar que nos surja una duda: ¿la especiali- 
zación es realmente una característica del tesauro o no se ha presentado la 
oportunidad de desarrollar un tesauro universal? 

Por un lado, desarrollar un tesauro es una iniciativa costosa; por otro 
lado, existen SOC universales que con periódicas actualizaciones han dado 
solución a las bibliotecas generales o similares. Entonces, es posible que no 
se haya planteado la necesidad de construir un tesauro general o enciclopédi- 
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co, lo cual no significa que no se pueda hacer. De hecho, las experiencias 
de interoperabilidad entre tesauros que se han llevado a cabo desde hace 
varias décadas, de alguna manera reflejan la necesidad de contar con te- 
sauros más generales en cuanto a su alcance temático (Martínez Tamayo 
et al., 2011b). 

Más aún, la pretendida tesaurización de algunas listas de epígrafes uni- 
versales como LCSH, Sears y, en América Latina, la versión digital de LEMB 
y la lista ARMARC, si bien insatisfactoria en sus resultados (Dykstra, 1988; 
Martínez Tamayo €: Valdez, 2009; Rolland-Thomas, 1989), también sugiere 
la posibilidad de un tesauro universal. 

No obstante y a pesar de nuestras dudas, aquí aceptamos el carácter espe- 
cializado que suele asignarse al tesauro. 


Las funciones del tesauro 

El tesauro surgió con el fin de facilitar la indización y la búsqueda en 
sistemas de almacenamiento y recuperación (SAR) como los catálogos de bi- 
blioteca o las bibliografías, es decir, para “guiar al indizador y al usuario final 
en la elección del mismo término para el mismo concepto” (ISO, 2011: 15). 
Esta función por supuesto sigue vigente hoy en día. Sin embargo, a partir del 
surgimiento de la Web —y especialmente de la Web semántica— el tesauro 
también se ha destinado a otras funciones, como la navegación, la búsqueda 
expandida o la asistencia en la indización automática. 


El tesauro en los registros bibliográficos y metadatos 

En una base de datos bibliográfica como un catálogo de biblioteca o una 
bibliografía, el tesauro cumple su función tanto en el proceso de indización 
como en el de búsqueda, que están íntimamente vinculados, como las dos 
caras de una moneda. El profesor australiano Antony C. Foskett (1996) ex- 
plica la relación entre estos procesos basándose en el conocido modelo de la 
comunicación de Shannon-Weaver (Figura 4.1). 

Brevemente, para Foskett el autor del contenido de un documento emite 
un mensaje (la obra), en un determinado código. Luego, el indizador decodi- 
fica el mensaje del autor, lo interpreta y describe en un registro bibliográfico 
que es almacenado en la base de datos, emitiendo así un nuevo mensaje, en 
un nuevo código: los términos y nombres propios del tesauro (Figuras 1 y 2). 
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Figura 1. Modelo de los procesos de indización y recuperación. Muestra al 
autor como emisor, la obra como mensaje, el usuario final como receptor y 
al indizador como intérprete. 


Emisor Mensaje Intérprete Receptor 
(autor) (obra) (indizador) (usuario) 


> consulta 
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Figura 2. Registro bibliográfico de un catálogo en línea.' La flecha señala 
los términos preferentes, que han sido tomados del Tesauro de la Unesco. 
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l Registro bibliográfico del catálogo de la Biblioteca de la Facultad de Humanidades y 


Ciencias de la Educación de la Universidad Nacional de La Plata. 
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Por su parte, el usuario final presenta su consulta utilizando también los 
términos y nombres propios del tesauro y el sistema le devuelve una respues- 
ta, que decodifica e interpreta; es, por tanto, el receptor final del mensaje. 

El tesauro también puede usarse para la indización de un recurso Web 
mediante un registro metadatos. Este tipo de registros puede incrustarse en el 
mismo documento o puede generarse aparte y enlazarse por un hipervínculo 
(Angelozzi € Martín, 2010). Su normalización se basa en un esquema meta- 
datos como el de la Dublin Core Metadata Initiative (DCMD), dentro de cuyos 
elementos se encuentran las palabras claves, notaciones, epígrafes o términos 
preferentes de un tesauro, que es la opción recomendada (DCMI, 2012). En 
la Figura 3 se muestra un ejemplo de registro metadatos. 


Figura 3. Registro de metadatos de un repositorio institucional.? Nótense 
las etiquetas DC que corresponden al esquema de la DCMI. 
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De modo que el tesauro, en cuanto SOC, tiene una función claramente 
definida: indizar y recuperar el conocimiento registrado. Esta función hace 


? Registro de metadatos del repositorio Memoria Académica de la Facultad de Humanida- 
des y Ciencias de la Educación de la Universidad Nacional de La Plata. 
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que el tesauro sea distinto, por ejemplo, de los bancos terminológicos, los 
glosarios y los diccionarios de sinónimos e ideas afines, que si bien muestran 
similitud, tienen otras finalidades. 


El tesauro de segunda generación y sus nuevas funciones 

La profesora canadiense Michele Hudon recuerda que las primeras dis- 
cusiones sobre las ventajas de la publicación electrónica de tesauros tuvieron 
lugar en la última década del siglo veinte y resaltaban principalmente la re- 
ducción de los costos, así como la expectativa de un incremento en la dispo- 
nibilidad de tesauros en la Web y del uso de estos. Pero afirma Hudon: “Lo 
que era visto como una opción atractiva en 1995 se convirtió rápidamente 
en la única opción si es que los tesauros han de cumplir un rol en el nuevo 
mundo de la información” (Hudon, 2003: 116). 

Hudon distingue entre los tesauros de primera generación y los tesauros 
de segunda generación. Los primeros son tesauros estáticos, en su mayoría 
impresos. Algunos han sido digitalizados y se encuentran en la Web como 
archivos PDF. Otros, si bien en formato html, no agregan mayores innovacio- 
nes ni facilitan su uso en diferentes aplicaciones. 

Por el contrario, el tesauro de segunda generación debe ser dinámico, con 
registros almacenados en una base de datos accesible mediante los motores 
de búsqueda como Google o Yahoo. Los términos preferentes y las formas 
autorizadas del nombre deben estar hipervinculados entre sí mediante sus re- 
laciones semánticas. El tesauro debe facilitar la navegación a través del orden 
sistemático y el orden alfabético. Tiene que ser fácil de consultar, intuitivo, 
con mínimas instrucciones y ayudas suficientes, pero simples. Es importan- 
tísimo que el tesauro pueda interactuar con distintas aplicaciones como las 
bases de datos bibliográficas, los sitios Web, etc. y estar disponible en los 
puestos de trabajo tanto del indizador como del usuario final. 

Una de las funciones que cumple el tesauro en un sistema de recuperación 
moderno es su apoyo a la indización automática. Es una técnica basada en pro- 
gramas informáticos que seleccionan y procesan las palabras del texto de los 
documentos y las convierten en términos de indización. La indización automática 
se basa en el análisis lingiístico (morfológico, sintáctico y semántico) y en el 
análisis estadístico (frecuencia u ocurrencia de una palabra y su ponderación). El 
proceso es el siguiente (Cleveland € Cleveland, 2013; Gil Leiva, 2008): 
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+ Eliminación de palabras vacías: el sistema descarta artículos, preposi- 
ciones, conjunciones, etc., mediante una lista de palabras vacías o sto- 
pword que la computadora pueda desechar. 

+ Análisis lingúístico: el sistema realiza la desambiguación de términos, 
la lematización (steeming) y el análisis tanto de la sintaxis como de la se- 
mántica. 

+ Análisis estadístico: cálculo de la frecuencia de palabras y frases en el 
texto y en la colección y ponderación de las mejores palabras y frases. 


La función del tesauro en la indización automática consiste en facilitar 
la traducción de las palabras o frases seleccionadas por la computadora a los 
términos preferentes del tesauro. Esto se hace mediante métodos de mapeo 
que le dan consistencia a la indización, ya que la computadora selecciona 
palabras, pero no distingue conceptos. 

Otra función del tesauro de segunda generación es la de facilitar la bús- 
queda expandida, que se define como la etapa del proceso de recuperación 
en la que se enriquece la pregunta inicial del usuario mediante la adición de 
términos que mejoran la recuperación. Almazán (2012) se refiere a esta fun- 
ción como inducción, dado que el tesauro guía o induce al usuario hacia otros 
términos que pueden interesarle para su búsqueda. Esta función de búsqueda 
expandida es útil porque los términos empleados por el usuario no siempre 
reflejan con exactitud su verdadero interés. El aporte del tesauro en este caso 
consiste en mapear los términos de búsqueda del usuario contra los términos 
preferentes del tesauro, sugiriendo las relaciones jerárquicas y asociativas 
correspondientes y facilitando la navegación. 

En un estudio realizado por Shiri y Revie (2006) sobre la base de datos 
CAB abstracts, especializada en ciencias biológicas, se comprobó que el 60% 
de las búsquedas se expandieron mediante los términos del tesauro. De ellas, 
los usuarios seleccionaron principalmente relaciones jerárquicas y, en menor 
proporción, las asociativas. Sin embargo, los autores mencionados señalan 
que en otras investigaciones las relaciones asociativas han sido las preferidas 
por los usuarios para la expansión. Como quiera que sea, la búsqueda expan- 
dida por medio de un tesauro es una ventaja. 

El tesauro puede cumplir además con otras funciones, como la verifica- 
ción de la ortografía y la sugerencia de términos alternativos, como la típica 
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opción ¿Quiso decir ...? que se encuentra disponible en los motores de bús- 
queda de la Web o en los nuevos catálogos NextGen. 

Hudon (2003) va más allá y propone que los tesauros deben considerarse 
imprescindibles no solo para las bases de datos bibliográficas disponibles en 
la Web, sino también para los portales temáticos e incluso para los motores 
de búsqueda de la Web. 


Tipos de tesauros 

Un macrotesauro es un tesauro de cobertura temática amplia, que sue- 
le tener un bajo nivel de especificidad, mientras que un microtesauro es un 
tesauro dedicado a un campo de conocimiento restringido, con un alto nivel 
de especificidad (Barité et al., 2013). Un macrotesauro puede actuar como 
paraguas para interconectar varios microtesauros, de modo tal que los temas 
generales sean indizados por el macrotesauro y los específicos por alguno de 
los microtesauros. 

Un tesauro de búsqueda es un tesauro que intenta asistir al usuario final 
durante la etapa de recuperación, aun cuando el sistema de información se 
maneje solo con lengua natural, para lo cual sugiere las posibles relaciones 
de equivalencia, jerarquía y asociación (Aitchison et al., 2000; Bates, 1986, 
1989). Un tesauro común, que se utiliza para la indización, puede usarse tam- 
bién como tesauro de búsqueda. 

Un tesauro multilingiie es un tesauro en varios idiomas. El tesauro de 
UNBIS? creado por la Biblioteca Dag Hammarskjóld de la ONU, con sus 
versiones en árabe, chino, inglés, francés, ruso y español, es un ejemplo de 
tesauro multilingiúe. Otros tesauros del sistema de la ONU cuentan también 
con esta característica. 

Un clasauro es un SOC híbrido entre el tesauro y el sistema de clasifica- 
ción. Introducido por Bhattacharyaa (1982), su finalidad es utilizar un solo 
SOC para la indización y la clasificación, es decir, para describir el conteni- 
do de los documentos en el catálogo o la bibliografía y para ordenar dichos 
documentos en el estante u otro tipo de ordenamiento sistemático. El SOC 
Chinese Classified Thesaurus de la Biblioteca Nacional de China es un ejem- 
plo de clasauro. 


3 http://1ib-thesaurus.un.org/LIB/DHLUNBISThesaurus.nsf/$$searche 
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Autoevaluación 


¿Qué es un tesauro? 


¿Cuáles son los componentes del tesauro? Explique cada uno de ellos. 


Describa las funciones del tesauro en una base de datos bibliográfica según 
Foskett. 


¿Qué función puede cumplir el tesauro en la indización automática? 


¿Qué función puede cumplir el tesauro en la búsqueda expandida? 


¿Qué tipos de tesauros podemos encontrar? 
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5. La historia del tesauro 


En este capítulo trataremos sobre el origen del tesauro, que está íntima- 
mente ligado a la aparición de la indización poscoordinada, y esta, a su vez, 
a la necesidad de procesar la enorme cantidad de información científica y 
tecnológica generada por la investigación en el siglo veinte. 


El origen de la indización poscoordinada 

Si bien hubo algunos antecedentes previos, puede decirse que la indi- 
zación poscoordinada comenzó hacia fines de la Segunda Guerra Mundial. 
Debido justamente a la guerra, se produjeron en los países beligerantes can- 
tidades masivas de informes técnicos que registraban los resultados de in- 
vestigaciones relacionadas con el conflicto y, hacia el final de la contienda, 
se sumaron a estos millones de documentos obtenidos en los países vencidos 
(Chu, 2003; Varlejs, 2004). 

De igual modo, la posguerra trajo consigo una expansión aun mayor de la 
investigación científica y los desarrollos tecnológicos, estimulada por los al- 
tos presupuestos que destinaron a estos fines los gobiernos, las universidades 
y la industria. El resultado fue un nuevo flujo de conocimiento y, por exten- 
sión, una avalancha de publicaciones científicas. Este fenómeno es conocido 
como la explosión de la información y afectó principalmente a las revistas 
especializadas y a los sistemas de recuperación. A manera de ejemplo, entre 
1910 y 1960 la literatura sobre economía creció de 5.000 a 40.000 artículos 
por año y la de psicología de 30.000 a 90.000 (ISSN Center, 2011; Riaz, 
1989; van Dijk, 1972). Así, el número de publicaciones periódicas registró un 
crecimiento exponencial durante todo el siglo veinte (Figura 1). 

Hacia 1970 las revistas científicas o académicas comunicaban al menos 
el 70% de los nuevos conocimientos y desarrollos tecnológicos (Mijailov 
8 Guiliarevski, 1974). A esto había que agregar los informes técnicos, las 
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patentes, las normas, las tesis y un largo etcétera, que incluía además las 
imágenes fijas y en movimiento u otros materiales multimedia con contenido 
científico, por ejemplo, las fotografías de microorganismos tomadas a través 
de un microscopio, las imágenes del nacimiento de una estrella captadas por 
un telescopio, o el registro fílmico de un conflicto social. 


Figura 1. Crecimiento de las publicaciones periódicas desde 1800 hasta 
2000. Alrededor de 100 títulos en 1800, 1.000 títulos en 1850, d.10.000 en 
1900, 100.000 en 1950 y 1.000.000 en 2000 (Fuentes: ISSN Center, 2011, 








Ríaz, 1989). 
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Antes de la Segunda Guerra Mundial, prácticamente la única forma de 
indización conocida era la asignación de epígrafes, pero llegó un momen- 
to en que esto no fue suficiente para el procesamiento de los documentos 
y se hizo necesario probar con algo nuevo. Las propuestas innovadoras 
culminaron en lo que hoy conocemos como indización poscoordinada 
(Kilgour, 1998). 

Una de las primeras iniciativas en este sentido fue la del británico Wi- 
lliam E. Batten, quien se desempeñaba en el Britain's Imperial Chemical 
Industries, Patents and Intelligence Department. En 1944 Batten diseñó un 
sistema para indizar las patentes, basado en una ficha tabular cuya grilla o 
matriz de 20 filas por 20 columnas contaba con 400 celdas en total (Figura 2). 
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Las fichas diseñadas por Batten fueron conocidas como fichas peek-a-boo o 
fichas de coincidencia óptica. 

En el sistema de Batten, a cada ficha se le asignaba un término que se 
extraía del propio documento. Entonces, si el documento n? 46 era la patente 
de un ventilador para autos, se tomaba la ficha del término ventiladores y 
se abría un orificio en el número de documento correspondiente (el 46 en la 
Figura 2). Luego se tomaba la ficha de autos y se hacía lo mismo. Cuando 
el usuario solicitaba información sobre ventiladores para autos, se tomaban 
las dos fichas, se superponía una a la otra y se contrastaban contra una fuente 
de luz. El rayo de luz solo podía pasar por los orificios que coincidían en 
ambas fichas, que era justamente el número de documento que incluía ambos 
conceptos, es decir, el 46. 


Figura 2. Ejemplo de una ficha peek-a-boo de William E. Batten. Como se 
puede observar, el rayo de luz pasa por el orificio que se encuentra en la fila 
40, columna 6, es decir, el documento 46, que trata sobre ventiladores y autos. 
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Otra propuesta fue la del estadounidense Calvin N. Mooers, quien en 
1947 inventó una máquina a la que llamó Zator, capaz de coordinar dos o más 
fichas perforadas en el borde. Por cada documento ingresado en la colección, 
se abría una ficha Zatocard que soportaba un máximo de 40 perforaciones 
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en el borde (Figura 5.3). Cada perforación correspondía a un término, que 
Mooers denominó descriptor, de modo que se podían asignar hasta 40 des- 
criptores por documento. El sistema Zatocode servía para una colección de 
10.000 documentos o un poco más. 

Para la recuperación, se marcaban en la máquina Zator' los descriptores 
que se deseaba recuperar. Todas las fichas se colocaban en un dispositivo de 
la máquina, semejante a una caja, que al accionarse comenzaba a moverse, 
agitando todas las fichas de modo tal que solo aquellas que respondían a los 
descriptores indicados caían fuera de la caja. El sistema producía algunas 
recuperaciones falsas, pero en general fue eficaz. 

La tercera propuesta fue el sistema Uniterm del bibliotecario estadou- 
nidense Mortimer Taube. El sistema Uniterm era similar al de Batten, pero 
más sencillo. Alrededor de 1952, Taube diseñó una ficha con diez columnas 
numeradas del 0 al 9. Al igual que la ficha peek-a-boo, cada ficha Uniterm co- 
rrespondía a un término (de ahí la palabra uniterm o unitérmino). Taube con- 
sideraba equivocadamente que un término era igual a una palabra, de manera 
que el concepto escuelas públicas daba lugar a dos fichas: una para escuelas 
y otra para públicas. Luego de varias experiencias y críticas, quedó claro que 
esta modalidad provocaba numerosas recuperaciones falsas, por lo que Taube 
debió modificar su criterio y aceptar que muchos términos son frases. 

Por otro lado, cada documento ingresado en la colección recibía un nú- 
mero consecutivo que era anotado en la columna de la ficha, haciendo coin- 
cidir el último dígito del número de documento con el número de la columna. 
Por ejemplo, el documento 25 era anotado en la columna 5, el 282 en la co- 
lumna 2, el 1318 en la columna 8 y así sucesivamente. Para la recuperación 
en el sistema Uniterm se tomaban las fichas de los términos que se deseaba 
coordinar y se verificaba qué números de documento coincidían. En la Figura 
4 se muestra un ejemplo de la ficha Uniterm. 

A partir del sistema Uniterm, Taube concibió la teoría de la indización 
coordinada sobre la cual dictó numerosas conferencias. El debate surgido 
alrededor de esta teoría llevó a la conclusión de que en todo sistema de recu- 
peración es necesario coordinar los términos: en un caso, por ejemplo cuando 


Una fotografía de la máquina Zator puede verse en http://www.flickr.com/photos/ 
acrl/2387064291/ 
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se usa una lista de epígrafes, la coordinación la realiza el indizador en la 
etapa de almacenamiento y se denomina indización precoordinada; y en el 
otro, por ejemplo el tesauro, la coordinación la lleva a cabo el usuario en el 
momento de la recuperación y se conoce como indización poscoordinada. 
Los sistemas peek-a-boo, Zatocode y Uniterm fueron entonces los primeros 
de indización poscoordinada (Kilgour, 1998). 


Figura 3. Ejemplo de una ficha Zatocard de Calvin Mooers. En el cuerpo 

de la ficha se registraban los datos identificatorios del ítem y en el borde 

se perforaban los descriptores correspondientes, en este caso ventiladores 
y automóviles. 
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Como se mencionó, los sistemas poscoordinados se basaron en el uso de 
términos independientes, en lugar de las cadenas precoordinadas que carac- 
terizan a las listas de epígrafes. El problema que presentaban los unitérminos 
(una palabra vs. una frase) se vio agravado por otros aspectos, como las for- 
mas gramaticales, la sinonimia y la homonimia, así como la falta de un sis- 
tema de conceptos acorde con la especialidad o dominio de los documentos 
a ser indizados. 

El sistema Uniterm fue el primero en ser probado en una computadora: en 
1954 en la Naval Ordinance Test Station y en 1958 en la Gas Turbine Division 
of General Electric, ambos de Estados Unidos. Estas experiencias abrirían el 
camino para el procesamiento informático y para la creación del tesauro. 


= 7/9 = 


Figura 4. Ejemplo de la fichas Uniterm de Mortimer Taube. El documento 
que trata sobre ventiladores y autos es el 46, que se encuentra en la columna 6. 
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El origen del tesauro 

Como solución, se presentaron en Estados Unidos tres propuestas que, 
si bien fueron formuladas por separado, coincidían en señalar la necesidad 
de crear un nuevo tipo de SOC, basado en términos bien definidos y orde- 
nados sistemáticamente. Las tres propuestas también coincidieron en que 
ese SOC debía ser semejante al conocido diccionario de sinónimos e ideas 
afines Roget's thesaurus of English words and phrases y que debía acom- 
pañarse además de un índice alfabético (Aitchison €: Dextre Clarke, 2004; 
Roberts, 1984). 

Una de estas propuestas fue la de Calvin N. Mooers, a quien se acredita 
como autor del término recuperación de información y que, como ya vimos, fue 
el inventor del sistema Zatocode. En 1947 Mooers intercambió alguna corres- 
pondencia con varios colegas, proponiendo la creación de una lista de términos 
organizada sistemáticamente como el Roget's thesaurus. Denominó descriptores 
alos términos y diccionario de descriptores al nuevo SOC que proponía. 
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En el mismo año, Charles L. Bernier y Evan J. Crane del Chemical Abs- 
tract Service, sin conocer la propuesta de Mooers, hicieron un planteo similar 
y distinguieron tres tipos de relaciones: de subordinación, de coordinación y 
de equivalencia. Diez años después, el mismo Bernier sugirió la conexión de 
dos SOC de este tipo, en el sentido actual de macrotesauro y microtesauro. 

Por último, en 1951 Hans P. Luhn, ingeniero de la IBM, propuso organi- 
zar los términos en familias conceptuales y agregar un índice alfabético. Aun- 
que en algún momento Luhn se autoadjudicó la primicia del tesauro, se sabe 
que los otros autores mencionados le precedieron y que además él conocía la 
propuesta de Mooers. Tanto Luhn como Helen Brownson fueron los primeros 
en usar el término tesauro para referirse al nuevo SOC (Aitchison €: Dextre 
Clarke, 2004; Roberts, 1984; Vickery, 1960b). 

En 1957, B.E. Holm y L.E. Rasmussen, de la empresa E.I. du Pont de Ne- 
mours de Estados Unidos, iniciaron estudios para adoptar el sistema Uniterm 
de Mortimer Taube. No del todo satisfechos con este sistema y luego de varias 
modificaciones, en 1959 completaron el Technical thesaurus of the E.I. du Pont 
de Nemours 8 Co. Engineering Departament, que, según Lancaster (2002), 
puede considerarse el primer tesauro que entró realmente en operaciones. 


Las normas para el diseño y desarrollo de tesauros 

Después del tesauro de du Pont se desarrollaron otros como el Thesaurus 
of ASTIA descriptors en 1960, el Chemical engineering thesaurus en 1961 y 
el Thesaurus of engineering terms en 1964, todos en Estados Unidos, que en 
general siguieron la metodología de du Pont. 

Entre 1965 y 1967 se llevó a cabo el Proyecto LEX, coordinado por el 
U.S. Department of Defense, con la participación de otros organismos pú- 
blicos y privados, en particular relacionados con la industria y la tecnología. 
El proyecto tuvo dos productos: por un lado el Thesaurus of engineering 
and scientific terms que fusionaba y ampliaba los tesauros mencionados en 
el párrafo anterior y por el otro, las primeras directrices para el diseño de 
tesauros, que fueron aprobadas por el Committee on Scientific and Technical 
Information (COSATI) y recomendadas para todas las agencias del gobierno 
estadounidense (Lancaster, 2002). 

A partir de ahí comenzaron a desarrollarse diversas normas y directrices. 
Cabe aclarar que tanto las normas como las directrices son conjuntos de re- 


81 = 


glas e instrucciones que pueden seguirse para la ejecución de algo, en este 
caso del diseño y desarrollo de tesauros. La diferencia consiste en que una 
norma debe ser aprobada por un organismo normalizador como la Internatio- 
nal Organization of Standardization (ISO) en el ámbito internacional, o por 
los organismos nacionales correspondientes, como el Instituto Argentino de 
Normalización y Certificación (IRAM). En cambio, las directrices suelen ser 
recomendaciones de una institución de reconocido prestigio dentro de una 
especialidad, pero que no tiene el poder de aprobar normas, por ejemplo la 
Unesco o la IFLA. 

Según Lancaster (2002), el desarrollo de las normas y directrices para 
el diseño de tesauros siguió dos corrientes: una estadounidense y otra bri- 
tánica. La primera se inició justamente con las directrices de COSATI en 
1967. Sobre esta base, la Unesco redactó en 1971 sus directrices para te- 
sauros monolingiies, que tuvieron gran aceptación internacional (Unesco, 
1971). Estas directrices influyeron en la redacción y aprobación de la pri- 
mera norma internacional, que fue la ISO 2788 de 1974. Ese mismo año y 
también basada en COSATI, se redactó y aprobó la primera norma estadou- 
nidense, ANSI/NISO Z39.19:1974, que tuvo dos ediciones más en el siglo 
veinte y una cuarta en 2005. 

Paralelamente, en 1969 se publicó en Gran Bretaña el Thesaurofacet: 
a thesaurus and faceted classification for engineering and related subjects 
(Aitchison et al., 1969). Como su nombre lo indica, este tesauro se diseñó 
armonizando las directrices de COSATT con la metodología del análisis de 
facetas, creada por el bibliotecario indio Shiyali Ramamrita Ranganathan. El 
análisis de facetas tuvo desde el principio la fuerte adhesión de numerosos 
especialistas británicos que conformaron el CRG y para 1969 ya había sido 
aplicado al diseño tanto de sistemas de clasificación como a las listas de epí- 
grafes (Coates, 1988). 

Sobre la base de esta tradición británica, el organismo normalizador de 
ese país aprobó la norma BS 5723 de 1979; y dos miembros del CRG, De- 
rek Austin y Peter Dale, prepararon la segunda edición de las directrices de 
Unesco, publicada en 1981 y traducida al español tres años después. La nueva 
edición de las directrices de la Unesco tuvo otra vez una marcada influencia 
en la revisión de la norma ISO 2788 y, consecuentemente, la segunda edición 
de esta última fue publicada en 1986 (ISO, 1986). 
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En 1985, la Unesco publicó las primeras directrices para tesauros multi- 
lingúes, que dieron lugar a la norma ISO 5964 de ese mismo año (ISO, 1985). 
Más de dos décadas después, IFLA publicó sus directrices para este mismo 
tipo de tesauros (IFLA, 2009a). 

No bien comenzó el siglo veintiuno y ante el avance de la tecnología 
informática, se inició la revisión de la norma estadounidense 739,19, que se 
publicó en 2005 y fue revisada en 2010 (NISO, 2010). Por primera vez, una 
norma dejó de lado la presentación impresa y la gestión manual del tesauro 
para ocuparse principalmente de su presentación en línea, de las funciones 
que debe cumplir el software de gestión y de cómo debe orientarse hacia la 
interoperabilidad entre tesauros y otros SOC, incluyendo los tesauros multi- 
lingiies, que dejan así de tener una norma separada. Además de este aporte 
innovador, la ANSI/NISO Z39.19:2005 amplió su cobertura hacia otros SOC 
como las listas de términos, los anillos de sinónimos y las taxonomías, que 
escapan al alcance de la presente obra. 

Para no ser menos, el organismo normalizador británico, BSI Group, 
también decidió revisar su norma nacional. La nueva norma BS 8723-1/4 se 
publicó en cinco partes entre 2005 y 2008 (BSI Group, 2005-2008). Fiel a 
sus tradiciones, la norma británica conserva su orientación hacia el análisis 
de facetas, pero al igual que la estadounidense pone el énfasis en adecuar el 
tesauro a las nuevas tecnologías de la información y la comunicación. Ade- 
más del tesauro, también esta norma incluye otros SOC como los sistemas de 
clasificación, las listas de epígrafes, las taxonomías y las ontologías, que no 
trataremos aquí. 

Por último, la norma internacional también ha sido objeto de revisión. 
Las normas ISO 2788:1986 para tesauros monolingiies y la ISO 5964:1985 
para tesauros multilingiies se dieron de baja y han sido sustituidas por una 
única norma publicada en dos partes: la ISO 25964-1/2. La parte 1, dedicada 
al tesauro, apareció en 2011 y la parte 2, dedicada a la interoperabilidad del 
tesauro con otros SOC, se publicó en 2013. Como sucedió anteriormente, la 
nueva norma ISO está basada en la norma británica (ISO 2011; 2013). 


Los tesauros y las normas en Argentina 
En nuestro país, a mediados de la década de 1970, el Centro Argentino 
de Información Científica y Técnica (CAICYT) reunió a varios especialistas 
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nacionales para conformar un grupo de trabajo encargado de elaborar un In- 
ventario de lenguajes documentarios no tradicionales (CAICYT, 1980). El 
llamado Grupo CAICYT fue el principal promotor del Seminario Regional 
sobre Lenguajes de Indización, dictado por el profesor Frederick W. Lancas- 
ter (f), y auspiciado por la Unesco, que se llevó a cabo en Buenos Aires entre 
el 14 y el 26 de agosto de 1978 (Lancaster, 1985). Este seminario marcó un 
antes y un después respecto a los tesauros en nuestro medio, ya que el Grupo 
CAICYT se convirtió en un agente multiplicador de la metodología para el 
diseño y desarrollo de tesauros y organizó un nuevo seminario regional, des- 
tinado a docentes, que se realizó en 1982 (Molina €: Zítara, 1998). 

La consecuencia lógica de este impulso fue la aparición de los primeros 
tesauros argentinos, como el de recursos hídricos (Zítara, 1983) y el de psi- 
cología (García £ Monfasani, 1984, 2009), considerados entre los mejores 
tesauros en lengua española (Álvaro Bermejo et al., 1989a, b). 

Un hecho trascendente, que situó a la Argentina entre los países que dis- 
ponían de una norma nacional para tesauros monolingúes, fue la publicación 
de la norma IRAM 32057:1983 (IRAM, 1983). Esta norma se basó principal- 
mente en la primera edición de la ISO 2788:1974, debido a lo cual hoy en día 
se encuentra desactualizada (Martínez Tamayo € Mendes, 2010). Al cierre 
de esta edición, el Subcomité de Documentación de IRAM había iniciado las 
tareas correspondientes para adoptar una nueva norma IRAM-ISO 25964, 
que constituirá, sin duda, un valioso aporte al diseño y desarrollo de tesauros 
en nuestro país. 
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Autoevaluación 


¿Qué situaciones contribuyeron al surgimiento de la indización poscoordi- 
nada? 


Explique brevemente los sistemas de indización propuestos por Batten, 
Mooers y Taube. 


Describa las propuestas que surgieron ante el problema de los unitérminos. 


Explique cómo se inició el desarrollo de las normas y/o directrices para el 
diseño de tesauros. 


¿Qué aportes hicieron las normas estadounidense, británica e internacional 
(ISO 25964) publicadas en el siglo veintiuno? 


¿Qué suceso motivó la aparición de los primeros tesauros en Argentina? 


¿Cuál es la situación de la norma argentina para el diseño y desarrollo de 
tesauros? 
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6. Diseño y desarrollo del tesauro 


En este capítulo trataremos sobre el diseño y desarrollo del tesauro desde 
el punto de vista de la gestión de un proyecto. Para explicarlo nos permitimos 
recurrir al conocido Círculo de Deming y sus cuatro etapas: planificar, ha- 
cer, evaluar y actuar. Dentro de cada etapa, explicaremos algunas cuestiones 
esenciales para diseñar un tesauro. 


Consideraciones previas 

Antes que nada, debe tenerse en cuenta que el diseño y desarrollo de 
un tesauro suele ser muy costoso, tanto en dinero como en esfuerzo y en 
tiempo. Por lo tanto, antes de emprender un proyecto de esta envergadura, 
es necesario analizar las posibilidades de llevarlo a cabo. Un clásico análisis 
de fortalezas, debilidades, oportunidades y amenazas puede resultar adecua- 
do para este fin. No obstante, se recomienda poner atención a las siguientes 
cuestiones (Aitchison et al., 2000; ISO, 2011). 

¿Existe un tesauro sobre el dominio que interesa y en la lengua o lenguas 
que se necesita? Si la respuesta a esta pregunta es afirmativa, entonces 
conviene adquirir y utilizar ese tesauro. Si la respuesta es negativa, se buscan 
otras soluciones. 

¿Existe un tesauro sobre el dominio, pero en otro idioma, que pueda 
traducirse? Si la respuesta es afirmativa, habrá que obtener los permisos 
correspondientes de los autores y editores antes de poner manos a la obra. De 
lo contrario, se continúa buscando otra solución. 

¿Existe un tesauro O varios que se puedan adaptar? La adaptación 
puede ser de distintos tipos: se puede derivar un tesauro más específico 
(microtesauro) de un tesauro más general (macrotesauro); también se pueden 
fusionar dos o más tesauros ya existentes que por separado no satisfacen todas 
las necesidades; convertir un sistema de clasificación en un tesauro, o recurrir 
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a otros métodos de interoperabilidad (Martínez Tamayo et al., 2011b). Si la 
respuesta a esta pregunta es afirmativa, entonces también se procede a obte- 
ner los permisos correspondientes antes de emprender las acciones. 

¿Se cuenta con los recursos suficientes para completar el tesauro y 
su publicación? Si se inician las tareas de diseñar un tesauro y este queda 
inconcluso por la falta de recursos, el costo habrá sido inmenso, porque se 
perderán los recursos invertidos sin haber logrado el objetivo. 

¿Se dispondrá de recursos para actualizarlo periódicamente en el 
futuro? El vocabulario de un tesauro no es estático; por el contrario, es 
necesario revisarlo en forma continua para descartar los términos que han 
dejado de usarse, modificar los términos que así lo requieran e incorporar 
términos nuevos. 

Si las respuestas a las preguntas anteriores lo justifican, entoncesy solo 
entonces se puede pensar en diseñar un nuevo tesauro. 


Planificar el tesauro 
Una vez tomada esta decisión, se deben tener en cuenta otras considera- 
ciones que hacen a la gestión del proyecto. 


Equipo de trabajo 

El diseño y desarrollo de un tesauro no puede ser obra de una sola perso- 
na, pues se trata de un proyecto complejo. Se necesita conformar un equipo 
de trabajo multidisciplinario, que puede requerir: 

a. Un director responsable de la conducción y coordinación del proyecto 

y la obtención de los recursos. 

b. Profesionales de la BDCI con experiencia en el diseño y desarrollo de 

tesauros. 

Cc. Futuros usuarios. Un tesauro suele tener dos tipos de usuarios: los in- 

dizadores responsables de la indización y los usuarios finales que actúan 

en la recuperación. Es muy conveniente que representantes de ambos 

grupos participen activamente en el equipo de trabajo. 

d. Expertos en el dominio del tesauro, con conocimiento específico sobre 

la terminología de ese dominio. 

e. Informáticos y diseñadores gráficos que aporten la tecnología necesaria 

para poner a punto el software de gestión del tesauro, diseñar una versión 
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amigable y atractiva en línea y asesorar sobre otros temas de su incumbencia. 
f. Si se decide que el tesauro sea multilingije, se requerirá también la 

participación de al menos un traductor por cada idioma extranjero. 

g. Es conveniente contar con la asesoría de lingiiistas y terminólogos. 

h. Se deberá disponer además de personal auxiliar suficiente para el tra- 

bajo de secretaría y gestión administrativa. 


Todo esto, desde luego, en la medida justa que se necesite. 

Los miembros del equipo de trabajo mencionados en los incisos a-d 
deben reunir ciertas cualidades como una buena cultura general, una sólida 
formación académica, conocimientos de idiomas extranjeros particularmente 
el inglés, aptitud para trabajar en equipo y conocimiento del dominio y la 
terminología del tesauro. 

Respecto al conocimiento sobre el dominio del tesauro, existen dos cues- 
tiones a tener en cuenta. El propósito de un tesauro es facilitar la indización 
y la recuperación del conocimiento registrado, que son actividades propias 
del profesional de la BDCL, es decir, este profesional es el que sabe qué es un 
tesauro y para qué se usa. Por otro lado, para diseñar un sistema de conceptos 
propio de un dominio, debe tenerse conocimiento de ese dominio, de modo 
que es imprescindible contar con los especialistas del área. Lo ideal sería 
que los profesionales de la BDCI tengan experiencia en el uso y el diseño de 
tesauros y que además estén familiarizados con el dominio y la terminología 
del tesauro, y que los expertos en el dominio del tesauro estén familiarizados 
con el uso y el diseño de tesauros. 


Plan de acción 

Una vez conformado el equipo de trabajo, este procederá a desarrollar el 
plan de acción del proyecto, especificando los objetivos, metas, resultados es- 
perados, los procesos que habrán de implementarse, los plazos de realización 
y los recursos necesarios para llevarlo a cabo. 

El plan también debe especificar a qué usuarios estará dirigido, así como 
el nivel de conocimiento que estos usuarios tienen tanto del dominio como 
del uso del tesauro. Por ejemplo, un tesauro sobre la enfermedad de Chagas 
para médicos será diferente a un tesauro sobre el mismo dominio dirigido a 
la comunidad en general. 
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También se deben determinar algunas características del tesauro: si será 
publicado en forma impresa, en línea o ambas; si habrá de integrarse a un 
sistema de recuperación particular o a una lista de autoridades de nombres; 
si debe ser compatible con otros SOC; si se aplicarán estrictamente las reco- 
mendaciones de las normas o se harán excepciones, etc. 


Los recursos 

La provisión de recursos exige un compromiso institucional sólido y a 
largo plazo para que el proyecto sea sostenible y sustentable. La responsabili- 
dad puede recaer en una sola institución o en varias, por ejemplo si el tesauro 
es parte de un proyecto colectivo. Los recursos a tener en cuenta son, entre 
otros, los siguientes: 


a. Recursos financieros y físicos 

Los recursos financieros deben asegurar tanto la finalización de una prime- 
ra edición del tesauro, como su actualización periódica a lo largo de los años. 

También se debe disponer de espacio físico adecuado, con el mobiliario 
y equipamiento tecnológico necesario y suficiente para que cada uno de los 
integrantes del equipo de trabajo pueda llevar a cabo su tarea. 


b. Recursos bibliográficos 

Es indispensable que el equipo de trabajo pueda contar con acceso per- 
manente a las fuentes que permitan extraer y verificar la terminología del 
dominio y decidir otros aspectos, ya sean tratados, manuales, revistas espe- 
cializadas, diccionarios, glosarios, enciclopedias, bases de datos bibliográfi- 
cas, bancos terminológicos, nomenclaturas, etc. Los tesauros u otros SOC es- 
pecializados en dominios relacionados también son de utilidad. Es preferible 
que estas fuentes estén disponibles en línea. 


Cc. Normas y manuales 

Para el diseño y desarrollo de tesauros conviene basarse en las normas 
que recomiendan las prácticas aceptadas y consensuadas. En nuestro país, 
en este momento, se hace necesario recomendar la norma internacional ISO 
25964 (ISO, 2011), en la que nos basamos aquí. Como se indicó en el capí- 
tulo 5, actualmente el Subcomité de Documentación del IRAM se encuentra 
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realizando las tareas necesarias para adoptar como propia la mencionada nor- 
ma, que será publicada como norma IRAM-ISO. Si bien las normas brindan 
una buena guía, se debe considerar que solo “pretenden recoger lo mejor 
de lo llevado a cabo hasta ahora, sin presuponer ni coartar los avances que 
se producirán en el futuro” (García Marco, 2006: 15). En otras palabras, la 
norma no se debe aplicar a ciegas, sino con una actitud crítica y teniendo en 
cuenta los avances posteriores. 

Hay dos manuales clásicos que cuentan con varias ediciones: uno es el 
de los británicos Aitchison et al. (2000) y el otro es del estadounidense Lan- 
caster (2002). Del ámbito iberoamericano se pueden mencionar el de Naumis 
Peña (2008), publicado en México, y los de Currás (1998) y Gil Urdiciain 
(2004) publicados en España. No obstante, debe tenerse en cuenta que ningu- 
no de estos manuales ha tomado en cuenta las normas publicadas en el siglo 
veintiuno. 

Todos los miembros del equipo multidisciplinario deben conocer en pro- 
fundidad la norma y tener acceso permanente a la consulta de los manuales 
y otras fuentes. 


d. Programa informático de gestión de tesauros 

Para gestionar el tesauro es necesario crear una base de datos específica, 
que requiere un programa informático apropiado. Hasta hace unos años, las 
normas y manuales se referían a este recurso como una herramienta para pro- 
ducir tesauros impresos. Las normas publicadas en este siglo han puesto el 
énfasis en el tesauro electrónico, disponible en la Web. Para esto se recomien- 
da un software que gestione la base de datos del tesauro, pero también que sea 
compatible con modelos de datos como SKOS o MADS y los programas de 
intercambio como el XML. En el capítulo 12 se tratan estos temas. 


Hacer el tesauro 

Los procesos de diseño y desarrollo del tesauro deben especificarse en la 
etapa de planificar y llevarse a cabo durante la etapa de hacer. Para implemen- 
tar estos procesos es indispensable cumplir rigurosamente con el principio de 
garantía, que se explica en el Apartado 6.6. Hay experiencias de tesauros de- 
sarrollados por medios automatizados o semiautomatizados, aunque muchos 
requieren total o parcialmente el trabajo intelectual de los expertos. 
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Tradicionalmente, las normas y manuales han sugerido tres métodos para 
abordar el diseño y desarrollo de un tesauro. Como es costumbre en la BDCI, 
cada uno de ellos ha recibido variados nombres (AENOR, 1990; Aitchison 
et al., 2000; BSI Group, 2005-2008; Gil Urdiciain, 2004; ISO, 2011; IRAM, 
1983; Lancaster, 1985, 2002; Naumis Peña, 2008; NISO, 2010). 


Método deductivo, teórico, sintético, a priori o top-down 

Un grupo de expertos en el dominio del tesauro, basado en distintas obras 
de referencia especializadas, identifica aquellos conceptos más generales y a 
partir de ellos construye el orden sistemático de arriba hacia abajo, es decir, 
organizando los conceptos de lo general a lo específico. Una vez completado 
el orden sistemático, se procede a realizar el control del vocabulario de los 
términos y nombres propios incluidos. 

Este método resulta útil para preparar el orden sistemático, pero presenta 
inconvenientes en los niveles jerárquicos más bajos, ya que al basarse en el 
juicio de los expertos, la colecta de términos puede resultar incompleta y las 
decisiones pueden apartarse del principio de garantía. 


Método inductivo, empírico, analítico, a posteriori o bottom-up 

Primero se colectan los términos y nombres propios de distintas fuentes 
bibliográficas, por alguna técnica de extracción de palabras claves o de es- 
tudios bibliométricos. Si se puede acceder a las historias de búsqueda de los 
usuarios finales de bases de datos relacionadas con el dominio del tesauro, 
también se extraen los términos de búsqueda. A medida que se van colectan- 
do los términos y nombres propios, se procede al control del vocabulario y se 
van agrupando para establecer los niveles jerárquicos de abajo hacia arriba, 
es decir, de lo específico a lo particular. 

Gil Urdiciain (2004) recomienda la indización de unos 2000 documentos 
y la colecta de unos 15.000 términos antes de organizar las jerarquías. Aun- 
que estas cifras dan idea del tamaño de un tesauro, debe tenerse en cuenta 
que hay tesauros con un número mayor o menor de términos, dependiendo 
de cada dominio. Lancaster (1985) relaciona la colecta con la disminución de 
términos nuevos. En la Figura 1 se muestra la curva propuesta por ese autor 
para vigilar el momento en que la cantidad de términos nuevos disminuye, 
que es el momento de comenzar a organizar las jerarquías. 
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Figura 1. Curva de crecimiento de términos. En el inicio de la colecta hay 
un crecimiento pronunciado porque todos los términos son nuevos, pero 
en cierto momento comienzan a repetirse y la incorporación de términos 

nuevos disminuye (Lancaster, 1985). 


Términos | 


Tiempo 


El método inductivo resulta efectivo para lograr un vocabulario completo 
y cumple estrictamente con el principio de garantía, pero al no contar con 
un orden sistemático previo, se complica la organización de los términos y 
nombres propios. 


Método mixto o híbrido 

Este método, fuertemente recomendado por la norma ISO 25964, combi- 
na los dos anteriores. Así, el grupo de expertos esboza un orden sistemático 
preliminar, mientras que la colecta de términos se realiza extrayendo los tér- 
minos y nombres propios mediante procesos informáticos. 

Los términos y nombres propios seleccionados son controlados y dis- 
tribuidos en las distintas categorías ya establecidas en el orden sistemático 
preliminar. A medida que se avanza en la tarea, se van realizando los ajustes 
en el orden sistemático esbozado, de modo que todos los términos y nom- 
bres propios sean ordenados, aun cuando no hayan sido tomados en cuenta 
inicialmente. 

Este método mixto permite lograr un vocabulario completo y organizar 
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el orden sistemático con un estricto cumplimiento del principio de garantía. 


Los procesos del diseño y desarrollo de un tesauro 

A continuación se presentan los principales procesos del diseño y desa- 
rrollo de tesauros. Algunos autores se refieren a estos procesos como etapas 
o fases (Gil Urdiciain, 2004; Naumis Peña, 2008; Shearer, 2004), pero en 
este manual, como se explicó en el capítulo 2, los consideramos procesos de 
organización del conocimiento. 


a) Definición y análisis del dominio 

Como ya se mencionó, una de las características del tesauro es su con- 
dición de SOC especializado en un dominio. En consecuencia, un primer 
proceso a llevar a cabo es definir y analizar el dominio del tesauro. 

Un dominio es el ámbito de una actividad, una esfera específica de co- 
nocimiento, influencia o actividad. Puede ser una disciplina, arte o profesión, 
una especialidad de estas o un campo multidisciplinario. 

Hay distintas recomendaciones para definir el dominio de un tesauro, que 
se mencionan en el capítulo 9. 


b) Control del vocabulario 
El proceso de control del vocabulario incluye varias operaciones, cuyo 
propósito es lograr un vocabulario normalizado y unívoco, es decir, contro- 
lado. Algunas de estas operaciones pueden realizarse en forma simultánea. 
*» Colecta: se realiza mediante el método inductivo ya descripto. Los tér- 
minos y nombres propios colectados se registran en la base de datos del 
tesauro como candidatos, es decir, están propuestos, pero aún no han 
sido analizados y aprobados. La extracción automática de palabras cla- 
ves es una técnica útil para la colecta. También hay experiencias en la 
aplicación de métodos bibliométricos para la colecta y selección de tér- 
minos candidatos. 
» Selección: no todos los términos y nombres propios candidatos deben 
pasar al tesauro. De hecho, se deberá analizar cada candidato y decidir si 
corresponde o no incluirlo en el tesauro. Este análisis significa estudiar 
en profundidad cada concepto general y el término que lo designa, así 
como cada concepto individual y el nombre propio que lo designa. 
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* Control de homónimos o desambiguación: cada término que se incorpora 
al tesauro debe representar un solo concepto general, es decir, no puede 
haber un término con dos significados distintos. De igual manera, un con- 
cepto individual debe estar representado por un solo nombre propio. 

* Control de sinónimos: si un término candidato tiene uno o más términos 
sinónimos, deberá elegirse uno y solo uno como término preferente y 
establecer una relación de equivalencia con los otros términos. De igual 
modo, si existen dos o más formas variantes para un nombre propio, 
deberá elegirse una y solo una como forma autorizada del nombre y esta- 
blecer una relación de equivalencia con las otras variantes. 

+ Normalización: se debe redactar una forma normalizada para cada térmi- 
no preferente y cada forma autorizada del nombre, siguiendo una norma 
pertinente. La norma ISO 25964 aporta las recomendaciones para las for- 
mas y accidentes gramaticales de los términos preferentes. Para normalizar 
los nombres propios conviene recurrir mejor a una norma de catalogación. 


En el capítulo 7 se describen las recomendaciones para el vocabulario del 
tesauro y la relación de equivalencia. 


Cc) Determinación de las relaciones jerárquicas y asociativas 

Una vez que se completa el control del vocabulario, se procede a estable- 
cer las relaciones jerárquicas y asociativas. Aitchison et al. (2000) se refieren 
a estas como relaciones de micronivel. En ambos casos se trata de una rela- 
ción entre dos conceptos y por lo tanto ambos elementos de la relación son 
términos preferentes, o bien uno es un término preferente y el otro una forma 
autorizada del nombre. Se detallan en el capítulo 8. 


d) Construcción del orden sistemático 

Este proceso consiste en organizar los términos preferentes y las formas 
autorizadas del nombre en un esquema lógico que evidencie el sistema de 
conceptos del dominio. Aitchison et al. (2000) se refieren a este orden como 
las relaciones de macronivel. 

Como se mencionó anteriormente, conviene esbozar el orden sistemático 
con anterioridad a la colecta de términos y nombres propios para facilitar la 
distribución de estos últimos en el orden sistemático y ajustar este a medida 
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que se procede en el análisis, hasta consolidar el orden sistemático definitivo. 

El análisis de facetas es la metodología recomendada para llevar a cabo 
el proceso de construcción del orden sistemático del tesauro y se describe en 
el capítulo 9. 


e) Publicación del tesauro 

Hoy en día la tendencia es publicar el tesauro en formato digital y no 
impreso, como era común hasta no hace mucho tiempo. De hecho, las normas 
de diseño y desarrollo de tesauros publicadas en este siglo veintiuno apenas 
hacen referencia a la versión impresa. 

Las recomendaciones para la publicación del tesauro se presentan en el 
capítulo 10. 


Evaluar el tesauro 

La tercera etapa del diseño y desarrollo de un tesauro es su evaluación. 
Hay dos evaluaciones a tener en cuenta: 

Evaluación previa a la publicación: antes de publicar la primera edición 
de un tesauro se recomienda hacer una evaluación, a modo de prueba piloto, 
que permita efectuar los ajustes necesarios antes de ofrecerlo al público 
para Su uso. 

Evaluación periódica: el tesauro debe ser evaluado a intervalos regula- 
res, para poder eliminar los posibles errores y determinar mejoras tanto en el 
vocabulario y las relaciones del mismo, como en el programa informático, 
especialmente en lo que hace a la interfaz usuario-sistema. En la evaluación 
se deben tener en cuenta las críticas y sugerencias de los usuarios del tesauro. 

En el capítulo 10 se hace referencia a las posibles formas de evaluación. 


Actuar para mejorar el tesauro 

Es la cuarta etapa del diseño y desarrollo de un tesauro. Una vez que se 
conocen los resultados de la evaluación, se deben hacer los ajustes necesarios 
para implementar las mejoras que surjan de la misma. 

En el capítulo 10 también se hace referencia al mejoramiento continuo 
del tesauro, especialmente a su actualización. 


Principio de garantía 


—95-— 


El diseño y desarrollo de un tesauro no surge de la nada. Debido a que 
el diseñador del tesauro se ve obligado a tomar decisiones importantes en 
cada uno de los procesos y operaciones de su diseño y desarrollo, resulta 
imprescindible que estas cuenten con un respaldo intelectual que garantice 
su validez. Hace más de un siglo que Wyndham Hulme postuló las bases de 
este principio, indispensable para desarrollar cualquier SOC (Barité, 2009, 
2011a,b). 

La profesora canadiense Clare Beghtol (1986) ha definido con exactitud 
el principio de garantía para un sistema de clasificación: 


En general, la garantía de un sistema de clasificación puede pensarse 
como la autoridad que un clasificacionista invoca primero para justificar 
y subsecuentemente para verificar decisiones acerca de qué clases/con- 
ceptos incluir en el sistema, en qué orden las clases/conceptos deben apa- 
recer en los esquemas, en qué unidades se dividirán las clases/conceptos, 
hasta dónde debe proceder la subdivisión, cuánto y dónde se dispone de 
síntesis, si los órdenes de mención son estáticos o variables y cuestiones 
similares (Beghtol, 1986: 110). 


Adaptando esta definición al tesauro, podemos afirmar que la garantía es 
la autoridad que invoca el diseñador del tesauro primero para justificar y lue- 
go para verificar sus decisiones acerca de los conceptos, términos y nombres 
propios que se han de incluir en el tesauro, las relaciones entre ellos, en qué 
lugar del orden sistemático deben aparecer, en qué unidades se dividirán y 
hasta qué nivel de especificidad debe completarse el proceso de división. Re- 
cuérdese que la síntesis y el orden de mención al que hace referencia Beghtol 
no se aplican al tesauro, por ser este un SOC poscoordinado. 

El principio de garantía ha evolucionado desde la primera aproximación 
de Hulme y hoy en día se ha especificado como señala Barité (2009, 2011a, b): 

Principio de garantía literaria, bibliográfica o documental: los conceptos 
que formarán parte del tesauro deben extraerse de una fuente bibliográfica 
especializada, ya sean tratados, manuales, artículos de revistas, informes téc- 
nicos, patentes, obras de referencia, etc., cualquiera sea su soporte físico. Los 
bancos terminológicos o las nomenclaturas, en particular los que proceden de 
organismos especializados en el dominio del tesauro, son también valiosos. 
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Principio de garantía del usuario: el tesauro debe tener en cuenta la termi- 
nología del usuario final. En este sentido, es muy útil revisar las historias de 
búsqueda (transaction logs) realizadas por los usuarios en bases de datos bi- 
bliográficas afines al tesauro que se desea desarrollar. También es convenien- 
te consultar a los usuarios finales a través de encuestas, entrevistas u otros 
medios y contar con un grupo de ellos como miembros del equipo de trabajo. 

Principio de garantía organizacional: el tesauro debe reflejar la termi- 
nología del organismo u organismos para los que se diseña. Este principio 
resulta particularmente importante cuando el tesauro se destina al sistema de 
gestión de conocimiento de una empresa, una agencia de gobierno u otros 
organismos. 

Principio de garantía cultural: el tesauro debe respetar la terminología 
y las particularidades culturales de la comunidad académica, profesional o 
social a la que estará dirigido. En este sentido es importante tomar en cuenta 
aquellos términos que pudieran resultar discriminatorios u ofensivos para los 
usuarios finales (Todaro 8: Martínez, 2006a,b). 
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Autoevaluación 
¿Qué debemos tener en cuenta antes de comenzar a diseñar un tesauro? 


Mencione cómo debe estar conformado el equipo de trabajo ideal para dise- 
ñar y desarrollar el tesauro. 


Indique qué recursos son necesarios para un proyecto de diseño y desarrollo 
de un tesauro. 


¿Qué normas y manuales conviene tener en cuenta para el diseño y desarrollo 
del tesauro? 


Describa las principales características que debe tener el software de gestión 
de tesauros. 


Describa los métodos deductivo, inductivo y mixto para el diseño y desarro- 
llo de tesauros. 


¿Cuáles son los procesos más importantes del diseño y desarrollo de un tesauro? 


¿En qué consiste el principio de garantía? 
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7. El vocabulario del tesauro 


En este capítulo presentaremos el vocabulario del tesauro. Este suele 
dividirse en dos: el vocabulario de indización y el vocabulario de entrada 
(Figura 1). El primero incluye los términos preferentes y las formas autori- 
zadas del nombre que pueden usarse en la indización; el segundo incluye los 
sinónimos, cuasi sinónimos y formas variantes del nombre, que no pueden 
usarse en la indización pero que remiten al término o al nombre aceptados. 


Figura 1. Vocabularios de indización y de entrada. Solo los términos prefe- 
rentes y las formas autorizadas del nombre pueden usarse para la indización. 


Pl HE plo 


de indizació -. 
Mars 


ir eS 
iaa 


riadas 
E 


EN MS 
variantes del 
RS 





El término preferente 

Es el signo más importante del tesauro. Un término preferente es “un 
término usado para designar un concepto cuando se indiza” (ISO, 2011). 
Como se indicó en el capítulo 3, un término es la designación verbal de un 
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concepto general, de modo que cada término preferente representa un con- 
cepto general (y solo uno) y cada concepto general es designado por un 
término preferente (y solo uno). El término preferente también se denomina 
descriptor muy difundido en nuestro país pero las normas, en general, pre- 
fieren término preferente como usamos aquí (BSI Group, 2005-2008; ISO, 
2011; NISO, 2010). 

Cuando se diseña un tesauro se debe elegir un único término para cada 
concepto; de ahí que se denomine término preferente, pues ha sido preferido 
sobre los demás sinónimos que pudieran corresponder. 

Sin pretender ser exhaustivos, a continuación se presentan algunos ejem- 
plos de términos preferentes: 

+ Cosas y sus partes físicas: 

animales salvajes 
automóviles de carrera 
patas 
radiadores 
ríos 
» Materiales: 
abrasivos 
acero inoxidable 
celulosa 
fósforo 
mármol de carrara 

* Actividades O procesos: 

auditoría externa 
cocción 
diagnóstico 
gestión de calidad 
oxidación 

+ Eventos o hechos: 

aniversarios 

apertura de cuenta 
carnavales 
festividades religiosas 
huelgas 
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* Propiedades de personas, cosas, materiales o acciones: 
personalidad 
elasticidad 
resistencia 
fortaleza 
opacidad 
* Disciplinas, oficios o campos temáticos: 
botánica 
carpintería 
ciencias de la tierra 
historia 
ingeniería biomédica 
paleontología 
+ Unidades de medición: 
kilogramo 
megabyte 
metro cúbico 
minuto 
milímetro 
*» Tipos de personas y organizaciones: 
jóvenes 
centros de investigación 
organismos internacionales 
personas adoptadas 
pintores 


Formas gramaticales de los términos preferentes 

Para la redacción de un término preferente se recomiendan tres formas 
gramaticales: un sustantivo, una frase nominal adjetivada o una frase nominal 
preposicional. 

Un sustantivo, sin artículo precedente, es la forma ideal para un término 
preferente, porque es la más fácil de recuperar y se considera un término 
preferente simple. Ejemplos: 

alegría 

alimentos 
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estética 
máquinas 
vuelos 


Sin embargo, es imposible que el vocabulario de un tesauro se forme so- 
lamente con términos preferentes simples, ya que en muchos casos se requie- 
re agregar al sustantivo un modificador, directo o indirecto. Se trata entonces 
de términos preferentes compuestos o multipalabra. Un término multipalabra 
puede ser de dos tipos: una frase nominal adjetivada es aquella cuyo núcleo 
es un sustantivo y su modificador un adjetivo (modificador directo). Se trata, 
entonces, de términos preferentes multipalabra. Ejemplo: 


asentamientos marginales 
discos compactos 
medicina alternativa 
pensamiento crítico 
vuelos espaciales 


Una frase nominal preposicional es aquella cuyo núcleo es un sustantivo 
y su modificador es una frase preposicional (modificador indirecto). En lo po- 
sible, deben evitarse y sustituirse por frases nominales adjetivadas. Por ejem- 
plo bibliotecas de hospitales podría sustituirse por bibliotecas hospitalarias. 
Además, las frases nominales preposicionales son las más afectadas por las 
reglas para fraccionar términos multipalabra, según se explica en el Apartado 
7.6 de este capítulo. Cuando no es posible sustituirlo, entonces puede redac- 
tarse un término preferente multipalabra como los siguientes: 


agencia de seguridad 
atención al cliente 
bibliotecas para ciegos 
patinaje sobre hielo 
vuelos de cabotaje 


En ocasiones es necesario incorporar al tesauro frases que no se ajustan a 
las tres formas gramaticales mencionadas, pero que están aceptadas y son de 
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uso común en un determinado dominio. Deben aceptarse sin cambios porque 
los usuarios finales del tesauro harán sus búsquedas por esas frases. Algunos 
ejemplos son los siguientes: 


cromatografía líquida de alto desempeño 
factor II de crecimiento similar a la insulina 
medios de comunicación de masas 
organizaciones no gubernamentales 
procesamiento automático de datos 


Los adjetivos, solos o como primera palabra del término preferente, no se 
permiten a menos que sean términos aceptados en el dominio del tesauro. Es 
común encontrarlos en idiomas como el inglés, pero son raros en lengua es- 
pañola. Por ejemplo, el Tesauro de UNBIS acepta como términos preferentes: 


libre autodeterminación de los pueblos 
libre comercio 
libre elección de empleo 


La norma estadounidense ANSI/NISO Z39.19:2005 propone la inclusión 
de algunos adjetivos con el fin de armar frases nominales adjetivadas (NISO, 
2010). Por ejemplo: 


Pequeños 
NA Combinese con un sustantivo, por ejemplo animales pequeños, au- 
tomóviles pequeños, etc. 


Esta opción es una invitación a la incoherencia y a la pérdida del control 
de vocabulario, ya que distintos indizadores podrían aplicarla con diferentes 
criterios. Por este motivo, la norma ISO 25964 prefiere no recomendar su prác- 
tica (ISO, 2011). En nuestra lengua, además, habría que tener cuidado con la 
coincidencia necesaria entre el género y el número de sustantivos y adjetivos. 

Los adverbios tampoco están permitidos como única o primera palabra del 
término preferente, a menos que sean de uso común en el dominio del tesauro. 
Por ejemplo, el Tesauro de UNBIS acepta los siguientes términos preferentes: 
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no alineación 
no proliferación nuclear 
no violencia 


Los verbos, en cualquier conjugación, tampoco pueden usarse como 
términos preferentes. En su lugar deben emplearse sustantivos; por 
ejemplo: fabricación y no fabricar, construcción y no construir, cura- 
ción y no curar. 

La frase coordinada, que une dos sustantivos con la conjunción y, si bien 
está permitida en las listas de epígrafes por su carácter precoordinado, no 
tiene sentido en un tesauro. Por ejemplo, los epígrafes diccionarios y en- 
ciclopedias o computadoras y mujeres, que están aceptados en las listas de 
epígrafes LEMB y ARMARC, en un tesauro deberían expresarse con cuatro 
términos preferentes: 


computadoras 
diccionarios 
enciclopedias 
mujeres 


La coordinación de estos términos se hará en el momento de la búsqueda 
mediante el uso del operador booleano AND; por ejemplo, diccionarios AND 
enciclopedias, computadora AND mujeres, computadoras AND diccionarios. 

Otra frase no permitida es la frase invertida, como golf, campos de o 
bien oración, libros de. Hace décadas se usaba en algunos SOC, sobre todo 
en inglés, con el propósito de anteponer el sustantivo, pero no tiene sentido 
en español. La norma ISO 25964 recomienda que, en cualquier idioma, se 
redacte el término preferente en el orden de la lengua natural (ISO, 2011). 
Por lo tanto, los ejemplos anteriores serían: campos de golf, libros de oración. 


Singular y plural 

La norma ISO 25964 establece distintos criterios para la redacción del 
término preferente en singular o en plural, según se trate de conceptos con- 
cretos o abstractos (ISO, 2011). 

Si es un concepto concreto y el núcleo del término preferente es un sus- 
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tantivo cuantificable —que puede responder a la pregunta ¿cuántos/as?— 
debe expresarse en plural. Por ejemplo: 


ampollas de vidrio 
empresas industriales 
fármacos 

libros infantiles 
mascotas 


Si es un concepto concreto y el núcleo del término preferente es un sus- 
tantivo no cuantificable —que puede responder a la pregunta ¿cuánto/a?— 
se redacta en singular. Por ejemplo: 


aluminio 

calor 

carbón vegetal 
colesterol 
cloruro de sodio 


En el caso de las partes del cuerpo, hay un tratamiento especial: si en 
un mismo organismo hay dos o más partes iguales, el término preferente se 
redacta en plural; si hay una sola, se redacta en singular. Por ejemplo: 


arteria aorta 

arterias 

brazos 

cerebro 

glándulas suprarrenales 


Generalmente, los conceptos abstractos se representan en singular, como 
se ejemplifica a continuación: 
+ El concepto es un fenómeno. Por ejemplo: 
felicidad 
personalidad 
verano 
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+ El concepto es una propiedad. Por ejemplo: 
claridad 
conductividad 
eficiencia 

+ El concepto es un sistema de creencias o una ideología. Por ejemplo: 
budismo 
cristianismo 
socialismo 

* El concepto es una acción. Por ejemplo: 
circulación sanguínea 
decoración de interiores 
fusión 

+ El concepto es una disciplina. Por ejemplo: 
administración de empresas 
ingeniería civil 
psicología 


No obstante, cuando el concepto abstracto posee varias especies, el tér- 
mino preferente se redacta en plural: 


ciencias biológicas 
ciencias exactas 
conjuntos 
ideologías 
reacciones químicas 


Hay casos en los que el singular y el plural tienen distintos significados, 
por ejemplo pintura como arte y pinturas como materiales con los que se 
pinta. Si se considera que la diferencia no está clara y puede prestarse a con- 
fusiones, deben diferenciarse con una nota de alcance como se indica más 
adelante en el apartado 7.7.3. 


Forma autorizada del nombre 
Un nombre propio es la designación verbal de un concepto individual, 
que a su vez representa un objeto único, como puede ser una persona, una 
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institución, un país determinado, una marca comercial, etc. Al igual que los 
términos preferentes, debe seleccionarse una (y solo una) forma autorizada 
del nombre para cada concepto individual. 

Hace unos años, tanto las normas como los manuales se referían a esta 
forma autorizada del nombre con el término identificador (Aitchison et al., 
2000; IRAM, 1983; Lancaster, 2002), pero las nuevas normas publicadas en 
el siglo veintiuno no solo han eliminado este término, sino que han cambiado 
su significado, definiéndolo como un número o símbolo que identifica al tér- 
mino preferente (BSI Group, 2005-2008; ISO, 2011; NISO, 2010). 

Otros autores prefieren referirse a los nombres propios como descrip- 
tores onomásticos, descriptores geográficos, descriptores temporales, etc. 
(Gil Urdiciain, 2004), pero las normas y directrices vigentes nunca han usado 
estos términos. La citada norma ISO 25964 los llama simplemente nombres 
propios, pero este término no distingue entre la forma autorizada y las formas 
variantes del nombre, de modo que hemos preferido utilizar estos dos últimos 
términos, según las recomendaciones de IFLA para el control de autoridades 
de nombres propios (IFLA, 2009b). 

Las formas autorizadas del nombre pueden ser de distinto tipo y a conti- 
nuación se muestran algunos ejemplos: 

+ Nombre propio de persona: 

Juan de la Cruz, Santo, 1542-1591 

Mafalda (personaje de historieta) 

McCartney, Paul, 1942- 

Bikila, Abebe, 1932-1973 

Sarmiento, Domingo Faustino, 1811-1888 
+ Nombre propio de dinastía o familia: 

Casa de Borbón 

Casa de Windsor 

Dinastía Ming, 1368-1644 

Dinastía Ptolomeica, 323-30 a.C. 

Rockefeller (familia) 

+ Nombre propio de ente corporativo: 

Aeropuerto El Tehuelche (Puerto Madryn, Argentina) 
Colombia. Ministerio de Comercio, Industria y Turismo 
Estudiantes de La Plata (club de fútbol) 
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Mura (restaurante : La Plata) 
Organización Panamericana de la Salud 

+ Nombre propio de un objeto o marca: 
Friendship 7 (nave espacial) 

Libertad (fragata) 
Red Door (perfume) 
Santa María (carabela) 
Tango 01 (avión) 

+ Nombre propio de acontecimiento o reunión: 
Congreso Nacional Bioquímico (11 : 2009 : Mar del Plata) 
Festival de Cine de San Sebastián (1953 : San Sebastián) 
Revolución de Mayo, 1810 
Tratado de Versalles, 1919 
Guerra Mundial, 1939-1945 

+ Nombre propio de título: 

Don Segundo Sombra 
Inmunología e inmunoquímica 
Quijote 

Rocky (película cinematográfica) 
Social science citation index 

+ Nombre propio de espacio (lugar o accidente geográfico): 

La Rioja (Argentina : provincia) 
La Rioja (España : provincia) 
Metrópolis (ciudad de historieta) 
Plaza Italia (La Plata, Argentina) 
Popocatépetl (volcán, México) 

+ Nombre propio de tiempo: 

Barroco, 1600-1750 

Edad Contemporánea, 1453-1789 
Gran Depresión, 1929-1934 
Período Hispánico, 1536-1810 
Quattrocento, 1400-1499 


Si el nombre propio incluye un artículo antes del sustantivo, la forma 
autorizada del nombre también debe incluirlo. Por ejemplo: 
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El Salvador 
La Habana (Cuba) 
Los Angeles Lakers (club de básquetbol) 


Un tesauro puede mostrar numerosos nombres propios, pero es muy di- 
fícil, si no imposible, que pueda incluir todos los que se necesitan a la hora 
de indizar en una biblioteca. Por ejemplo, el Tesauro de la Unesco posee la 
forma autorizada del nombre Argentina, pero no para Misiones o Río Negro. 
Posee el término preferente dramaturgo, pero carece de un nombre propio 
para Alejandro Casona o para Roberto Arlt. 

Para solucionar este problema, el diseñador del tesauro puede proporcio- 
nar una instrucción en una nota de alcance, por ejemplo: 


Argentina 

NA Úsese para obras sobre el país en general. Para las obras sobre una 
provincia o localidad, indícese por el nombre propio normalizado de 
acuerdo con una norma de catalogación, por ejemplo Santa Fe (Argenti- 
na : provincia). 


dramaturgos 

NA Úsese para obras sobre dramaturgos en general. Para obras sobre un dra- 
maturgo en particular indícese por el nombre propio normalizado de acuer- 
do con una norma de catalogación. Por ejemplo Miller, Arthur, 1915-2007. 


También se puede tomar la decisión de no incluir ningún nombre propio 
y aconsejar el uso de una lista de autoridades de nombres. 


Abreviaturas y siglas 

Las abreviaturas no están permitidas en el tesauro, porque afectan la re- 
cuperación. Se debe preferir familia a flia., provincia a prov., policía a pcia. 

Las siglas están permitidas cuando son más conocidas que el nombre in 
extenso, por ejemplo: UNESCO en lugar de Organización de las Naciones 
Unidas para la Educación la Ciencia y la Cultura, SIDA en lugar de síndrome 
de inmunodeficiencia adquirida o láser en lugar de light amplification by sti- 
mulated emission of radiation. 
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Términos multipalabra 

Como se ha mencionado, los términos preferentes pueden constar de una 
o varias palabras. La nueva norma internacional ISO 25964 usa el término 
multi-word term o término multipalabra en sustitución de término compuesto 
que utilizaban las normas anteriores, razón por la cual lo preferimos aquí 
(ISO, 2011). 

Los términos multipalabra pueden ser de dos tipos: una frase nominal 
adjetivada (escuelas públicas) o una frase nominal preposicional (bibliotecas 
para ciegos), las cuales están formadas por un núcleo y un modificador, di- 
recto o indirecto: 

+ Núcleo: siempre es un sustantivo y suele indicar el género al que per- 

tenece el término. En los ejemplos del párrafo anterior, los núcleos son 

escuelas y bibliotecas, respectivamente. 

+ Modificador directo: es un adjetivo y suele representar la especie. En el 

caso del primer ejemplo, el modificador directo es públicas. 

+ Modificador indirecto: es una frase preposicional. En el segundo ejem- 

plo, el modificador indirecto es para ciegos. 


En general, la norma y los manuales recomiendan fraccionar estos tér- 
minos multipalabra en sus elementos más simples, excepto cuando pueda 
afectar la comprensión del indizador y del usuario final. Sin embargo, como 
se mencionó, no todos los conceptos pueden expresarse con una sola pala- 
bra. Esta contradicción entre lo conveniente (una sola palabra) y lo necesario 
(dos o más palabras) genera problemas que deben resolverse (Atchison et al., 
2000; ISO, 2011; Lancaster, 2002; Naumis Peña, 2008). 

La principal ventaja del término preferente multipalabra es que mejora la 
tasa de precisión en el momento de la búsqueda, evitando las recuperaciones 
falsas. Por ejemplo, el término preferente control de calidad permite obtener 
mejores resultados que la coordinación de los términos preferentes control + 
calidad, ya que esta última opción podría recuperar un texto en el que se le- 
yera, por ejemplo, “el control de la ortografía es indispensable para la calidad 
del texto”, que no tiene nada que ver con el concepto “control de calidad”. 

Volviendo entonces a la norma ISO 25964, queda claro que siempre que 
sea posible, el término multipalabra debe descomponerse en términos más 
simples. Esta acción se conoce como fraccionamiento de términos multipa- 
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labra y puede ser de dos tipos: a) fraccionamiento semántico o b) fracciona- 
miento sintáctico. Pero si el fraccionamiento afecta la comprensión, entonces 
se mantiene el término multipalabra. 

A continuación se presentan las recomendaciones de la norma ISO 25964 
para mantener o fraccionar los términos multipalabra. Solo constituyen una 
guía, pero no son de aplicación obligatoria, pues cada uno de los casos que se 
presentan puede dar lugar a numerosas excepciones, dependiendo principal- 
mente de la conveniencia para los usuarios finales. 


Mantenimiento del término multipalabra 
En los siguientes casos debe mantenerse el término multipalabra: 
+ Cuando el término está aceptado y es de uso común entre los usuarios 
finales, según el dominio del tesauro. Por ejemplo: 
cromatografía capilar electrocinética micelar 
procesamiento digital de señales 
+ Cuando el fraccionamiento puede conducir a una pérdida de significado 
o ambigúedad; por ejemplo: alimentos + animales podría recuperar in- 
formación sobre animales que sirven de alimento o sobre alimentos para 
animales. 
+ Los términos que incluyen un nombre propio. Por ejemplo: 
enfermedad de Chagas 
teorema de Pitágoras 
+ Los términos cuyos modificadores han perdido su significado original. 
Por ejemplo: 
mesas redondas 
sillas de tijera 
+ Los términos cuyo modificador sugiere una semejanza, a modo de me- 
táfora o símil. Por ejemplo: 
estructuras de árbol no puede fraccionarse en estructuras + árboles, 
porque la recuperación no sería pertinente. 
+ Los términos multipalabra que al separarse producen otros términos 
que no llegan a cubrir el mismo concepto. Por ejemplo: 
establecimientos de salud 
piletas de natación 
+ Los términos en los que el núcleo posee un significado diferente en 
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ausencia del modificador. Por ejemplo: 
animales de peluche 
flores de papel 


Fraccionamiento semántico 

Un término —simple o multipalabra— que representa un concepto A, 
puede fraccionarse en varios términos preferentes que, si bien por separado 
representan conceptos diferentes, una vez poscoordinados pueden significar 
lo mismo que el concepto A. Por ejemplo: el término termómetros puede frac- 
cionarse en los términos preferentes temperatura + medición + instrumentos, 
que deberían asignarse juntos para significar termómetros. Igualmente, los 
términos fisicoquímica y biotecnología pueden fraccionarse, respectivamen- 
te, en los términos preferentes física + química y biología + tecnología. 

Esta técnica puede producir una fuerte pérdida de consistencia en la in- 
dización y de precisión en la recuperación, de modo que la norma ISO 25964 
no recomienda su aplicación. 


Fraccionamiento sintáctico 
Los términos multipalabra pueden fraccionarse sintácticamente en los 
siguientes Casos: 
+ Cuando el núcleo (subrayado) se refiere a una propiedad o parte y el 
modificador representa el conjunto o poseedor de tal propiedad o parte, 
se fracciona: 
motores de avión 


lámparas de cristal 


vagones de ferrocarril 
+ Los términos preferentes después del fraccionamiento serían: 


aviones 

cristal 

ferrocarriles 

lámparas 

motores 

vagones 
+ Contrariamente, cuando el núcleo es el todo o poseedor y el modifica- 
dor es la parte o propiedad, el término multipalabra se mantiene: 
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aviones comerciales 
cristal cortado 
ferrocarriles eléctricos 
+ Cuando el núcleo es una acción transitiva y el modificador es el objeto 
sobre el que recae la acción, se fracciona: 
consumo de agua 
laminación de acero 
cultivo de cereales 
Los términos preferentes resultantes después del fraccionamiento 
serían: 
acero 
agua 
cereales 
consumo 
cultivo 
laminación 
+ Contrariamente, cuando el núcleo es el objeto y el modificador es una 
acción que recae sobre aquel, se mantiene el término multipalabra: 
acero laminado 
agua potable 
cereales procesados 
+ Cuando el núcleo es una acción intransitiva y el modificador es el obje- 
to que realiza la acción, se fracciona: 
comportamiento del consumidor 
crecimiento del maíz 
oxidación de metales 
Los términos preferentes resultantes después del fraccionamiento 
serían: 
comportamiento 
consumidores 
crecimiento 
maíz 
metales 
oxidación 
+ Contrariamente, cuando el núcleo es el objeto y el modificador es una 
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acción en la que aquel ha estado involucrado, se mantiene el término 
multipalabra: 

consumidores informados 

maíz desgranado 

metales oxidados 


Como se puede observar, las frases con modificador indirecto son las más 
afectadas por el fraccionamiento sintáctico. 

Por otro lado, la norma ISO 25964 se hace eco de lo sugerido por Lancas- 
ter (2002); recomienda fraccionar las frases con dos modificadores directos. 
Por ejemplo: 


cámaras cinematográficas 
cámaras submarinas 
y no cámaras cinematográficas submarinas 


estructuras metálicas 
estructuras prefabricadas 
y no estructuras metálicas prefabricadas 


vuelos espaciales 
vuelos tripulados 
y no vuelos espaciales tripulados 


Fraccionamiento de nombres propios 
Los nombres propios nunca se fraccionan. Solo los términos preferentes 
y los términos no preferentes están sujetos a estas recomendaciones. 


Desambiguación: calificadores y notas 

Como ya se ha mencionado, los términos preferentes deben ser unívocos. 
Hay casos en que los términos resultan ambiguos y se requiere desambiguar- 
los. Existen dos recursos para hacerlo: los calificadores y las notas. 


Homógrafos y calificadores 
Los homónimos son términos que poseen un mismo significante pero 


is 


distinto significado. Pueden ser fonéticos (homófonos) o gráficos (homógra- 
fos). Estos últimos son términos de idéntica grafía, pero que designan con- 
ceptos diferentes. Para distinguir uno de otro en el contexto de un tesauro, se 
agrega al término preferente un término aclaratorio entre paréntesis, que se 
denomina calificador. Por ejemplo: 


diafragma (músculo) 
diafragma (dispositivo intrauterino) 


Mercurio (deidad) 
Mercurio (planeta) 
mercurio (metal) 


pinturas (materiales) 
pinturas (obras de arte) 


tanques (contenedores) 
tanques (vehículos militares) 


El calificador es parte del término preferente y por lo tanto no se pueden 
separar. El indizador deberá asignarlos tal cual aparecen en el tesauro. 

Por lo general el calificador se agrega solamente cuando los homógrafos 
aparecen en el mismo tesauro. Tomando el ejemplo de mercurio, es difícil 
que en un mismo tesauro se necesite distinguir entre la deidad y el metal. Sin 
embargo, hoy en día la interoperabilidad entre dos o más tesauros es cada vez 
más común y algunos consideran que es conveniente agregar el calificador 
aunque el homógrafo no aparezca en el mismo tesauro, en previsión de un 
posible proceso de interoperabilidad (ISO, 2011). 


Las notas 

La norma ISO 25964 establece tres tipos de notas, independientes unas 
de otras: la nota de alcance, la nota de definición y la nota histórica. Las 
normas anteriores incluían los tres tipos dentro de la nota de alcance, pero 
ha sido necesario separarlas para desarrollar el modelo de datos que reco- 
mienda la norma y que se describe en el capítulo 12 de la presente obra. En 
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este modelo, la nota de alcance se asocia con el concepto y las otras notas 
con el término. 


a) Nota de alcance 

Se trata de “una nota que define o clarifica los límites semánticos de un 
concepto” (ISO, 2011: 10). 

En otros países de lengua española se utilizan también los sinónimos 
nota aclaratoria, nota de aplicación, nota explicativa y nota de indización 
(AENOR, 1990; Gil Urdiciain, 2004; Gil Leiva, 2008). Nosotros preferimos 
mantener nota de alcance, que es la forma utilizada por la norma argentina 
IRAM 32057:1983 y en otros países latinoamericanos, como Uruguay y Mé- 
xico (Barité et al., 2013; IRAM, 1983; Naumis Peña, 2008). 

No todos los términos preferentes requieren una nota de alcance, solo 
aquellos que puedan resultar ambiguos. La nota se indica bajo el término 
preferente y su etiqueta es NA. Se reconocen varios tipos de nota de alcance 
(Aitchison et al., 2000; ISO, 2011; Lancaster, 2002): 


+ Nota de inclusión o limitación positiva. Ejemplo: 
educación artística 
NA Úsese para las obras que tratan sobre la enseñanza del dibujo, 
la gráfica, la pintura y la escultura. 


becas de estudio 
NA Úsese para las becas a estudiantes de los ciclos primario y se 
cundario. 


+ Nota de exclusión o limitación negativa. Ejemplo: 
desarrollo 
NA Excluye las obras que tratan sobre el desarrollo experimental o 
individual. 


personas desplazadas 


NA Excluye a los refugiados políticos. Para estos últimos úsese refu- 
giados. 
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+ Nota de instrucción. Ejemplo: 
arquitectos 
NA Úsese para las obras que tratan sobre los arquitectos en general. 
Para las obras que tratan sobre un arquitecto en particular, indícese 
por el nombre propio normalizado de acuerdo con una norma de 
catalogación, por ejemplo Mies van der Rohe, Ludwig, 1886-1969. 


anemia 
NA Úsese para obras muy generales. Prefiéranse en lo posible los 
términos específicos, por ejemplo anemia hemolítica. 


La nota de alcance puede ser recíproca, cuando involucra a varios con- 
ceptos. Por ejemplo: 


teatro 
NA Úsese para las obras sobre el teatro como género literario. Las obras 
sobre el local destinado a la representación teatral se indizan por teatros. 


teatros 
NA Úsese para las obras sobre el local destinado a la representación 
teatral. Las obras sobre el teatro como género literario se indizan por 
teatro. 


b. Nota de definición 

Como su nombre lo indica, la nota de definición proporciona la defini- 
ción de un término y es utilizada cuando el mismo puede interpretarse de 
modo ambiguo o equívoco. 

La norma internacional ISO 25964 recomienda que, si es necesaria una 
nota de definición, esta sea independiente de las otras notas (ISO, 2011). Mo- 
difica así las disposiciones de las normas previas, en las cuales la definición 
debía incluirse como una nota de alcance. La etiqueta para la nota de defini- 
ción es DEF. Por ejemplo: 


educación comparada 
DEF Estudio comparativo entre las teorías y prácticas educativas vigen- 
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tes en diferentes países. 

informática 

DEF Ciencia que estudia los medios físicos y lógicos para el tratamiento 
de la información. 


Las normas y manuales para el diseño de un tesauro coinciden en que no 
todos los términos preferentes requieren una nota de definición (Aitchison et 
al., 2000; ISO, 2011; Lancaster, 2002). No obstante, algunos autores su- 
gieren que sería conveniente que todos los términos preferentes contaran 
con una definición, e incluso —como se mencionó en el capítulo 3— se 
ha recomendado la definición por intensión (género próximo y diferen- 
cia específica) como conveniente no solo para desambiguar el término 
preferente, sino también para facilitar la identificación de las relaciones 
jerárquicas (Aguado et al., 1999; Barité, 2000a; Hudon, 1996; Vickery, 
1960a). De hecho, hay tesauros que efectivamente definen todos sus tér- 
minos preferentes. 


c) Nota histórica 

La nota histórica se incluye bajo un término preferente para indicar desde 
cuándo se utiliza el término y, en caso de modificación, relaciona el o los tér- 
minos preferentes que designaban anteriormente el mismo concepto. 

Para la norma ISO 25964, la etiqueta de la nota histórica es HN (histo- 
rical note). Las normas española y argentina, así como otras normas latinoa- 
mericanas vigentes, no contemplan todavía este tipo de nota, de modo que no 
se cuenta con una etiqueta normalizada en nuestra lengua (AENOR, 1990; 
IRAM, 1983; Oficina Nacional de Normalización, 2000; ICONTEC, 1998). 
En 2013, el Subcomité de Documentación de IRAM aprobó la etiqueta NH 
(nota histórica) para la norma IRAM-ISO 25963 que se encuentra en curso y 
así la usamos aquí. Los siguientes son ejemplos de notas históricas: 


Chequia 

NA Las obras sobre el territorio de Chequia, referidas a los años com- 
prendidos entre 1918 y 1992 deben indizarse por Checoslovaquia. 

DEF Estado europeo independiente fundado el 1 de enero de 1993, a 
partir de la división de Checoslovaquia. 
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NH Término incorporado el 1993-01-10. 


diabetes mellitus tipo 1 

UP diabetes juvenil 

UP diabetes mellitus insulinodependiente 

NH Sustituye a los términos en desuso diabetes juvenil y diabetes me- 
llitus insulinodependiente, de acuerdo con la recomendación del Expert 
Committee on the Diagnosis and Classification of Diabetes Mellitus de 
la American Diabetes Association. Término incorporado en 1997-09-01. 


Bajo un término preferente o una forma autorizada del nombre pueden 
aparecer, simultáneamente, notas de definición, de alcance e históricas. 


Relación de equivalencia 

Como señalamos anteriormente, el vocabulario del tesauro está formado 
por un vocabulario de indización y un vocabulario de entrada. El primero está 
integrado por los términos preferentes y las formas autorizadas del nombre; 
el segundo, por los términos no preferentes y las formas variantes del nombre 
que se incluyen en el tesauro solo para remitir, respectivamente, a los térmi- 
nos preferentes y a las formas autorizadas del nombre. 

Un término no preferente es un sinónimo o cuasi sinónimo del término 
preferente, que no se puede asignar en la indización pero que remite al térmi- 
no preferente de un tesauro. La forma variante del nombre es una forma del 
nombre propio que no se puede asignar en la indización, pero que remite a la 
forma autorizada del nombre en un tesauro. 

La relación entre un término preferente y un término no preferente, o 
entre una forma autorizada del nombre y una forma variante del nombre es 
una relación de equivalencia. Algunos autores la designan como relación de 
sinonimia (Naumis Peña, 2008), pero debe tenerse en cuenta que los términos 
considerados equivalentes en un tesauro no siempre son sinónimos en sen- 
tido estricto. Por otro lado, relación de equivalencia se encuentra aceptada 
por la norma argentina y otras en español (AENOR, 1990; ICONTEC, 1998; 
IRAM, 1983; Oficina Nacional de Normalización, 2000). 

En la relación de equivalencia se usan dos etiquetas: a) el término no 
preferente o la forma variante del nombre remiten al término preferente o a la 
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forma autorizada del nombre con la etiqueta USE, y b) el término preferente 
y la forma autorizada del nombre informan sobre los términos no preferentes 
y las formas variantes del nombre con la etiqueta UP, que significa usado por. 
Por ejemplo: 


cacahuate maní 

USE maní UP cacahuate 
Confederación Helvética Suiza 

USE Suiza UP Confederación Helvética 


Las etiquetas anteriores pueden sustituirse por los símbolos Y en lugar de 
USE y = en lugar de UP. Ejemplo: 


anacardos castañas de cajú 

Y castañas de cajú = anacardos 

Godoy Alcayaga, Lucila Mistral, Gabriela, 1889-1957 
(Y Mistral, Gabriela, 1889-1957 = Godoy Alcayaga, Lucila 


Cuando el diseñador de un tesauro se enfrenta con un conjunto de sinó- 
nimos o cuasi sinónimos, debe seleccionar uno de ellos como término pre- 
ferente. Para esto deberá guiarse estrictamente por el principio de garantía 
que se explica en el capítulo 6. Sin ánimo de ser exhaustivos, a continuación 
describimos algunos criterios para orientar la selección: 

* Origen lingúístico, por ejemplo: políglota USE multilingie. 

+ Nombre popular o científico: Solanum tuberosum USE papa. 

+ Nombre comercial o nombre común: biromes USE bolígrafos. 

* Siglas o nombre desarrollado: PVC USE policloruro de vinilo. 

» Términos actuales u obsoletos: diabetes juvenil USE diabetes tipo 1. 

* Variaciones ortográficas: sicología USE psicología. 

* Variaciones culturales: parqueos USE estacionamientos. 

» Términos prestados: estudio de mercado USE marketing. 

Los cuasi sinónimos son términos que, si bien no son sinónimos en un 
sentido estricto, en el tesauro son tratados como tales. Por ejemplo: 


trastornos mentales enfermedades mentales 
USE enfermedades mentales UP trastornos mentales 
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También pueden ser extremos de un continuum como algunos antónimos. 


Debe decidirse si se incorporan ambos términos o si uno de ellos representa 


al otro. Por ejemplo: 


frío 
USE calor 


desnutrición 
USE nutrición 


calor 
UP frío 


nutrición 
UP desnutrición 


Otra función de la relación de equivalencia es el llamado reenvío ascendente. 


En este caso, la relación se establece entre un concepto que no es necesario 


incorporar al tesauro, y otro concepto más general que lo incluya. Por ejemplo: 


ballenas 
USE cetáceos 


ingenieros mecánicos 
USE ingenieros 


cetáceos 
UP ballenas 


ingenieros 
UP ingenieros mecánicos 


Dentro de la relación de equivalencia, también se incluye el reenvío de un 


término multipalabra fraccionado a los términos preferentes que deben pos- 


coordinarse y se agrega un símbolo +. Por ejemplo: 


motores de camión 
USE motores + camión 
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camiones 
UP+ motores de camión 


motores 
UP+ motores de camión 


Autoevaluación 

Explique la diferencia entre vocabulario de indización y vocabulario de entrada. 
¿Qué es un término preferente? 

Describa las formas gramaticales recomendadas para un término preferente. 


Mencione en qué casos se debe redactar el término preferente en singular o 
en plural. 


Si se decide no incorporar nombres propios al tesauro: ¿qué prácticas se pue- 
den seguir? 


¿En qué casos se pueden usar abreviaturas o siglas en un tesauro? 
¿En qué casos se debe mantener un término multipalabra? 

¿En qué casos se debe fraccionar un término multipalabra? 
Describa los recursos para desambiguar un término. 

Explique la relación de equivalencia. 

¿Qué etiquetas y símbolos indican una relación de equivalencia? 


¿En qué casos se recomienda establecer una relación de equivalencia? 
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8. Las relaciones jerárquicas y asociativas 


En capítulos anteriores hemos mencionado que una de las características 
distintivas del tesauro es su red de relaciones explícitas. En este nos referire- 
mos a las relaciones jerárquicas y asociativas que forman parte del microni- 
vel señalado por Aitchison et al. (2000). 

Las relaciones jerárquicas y asociativas constituyen una red de referen- 
cias cruzadas que permite, tanto al indizador como al usuario final, elegir 
el término preferente o la forma autorizada del nombre que más convenga 
para indizar o para recuperar información (Aitchison et al., 2000; BSI Group, 
2005-2008; ISO, 2011; Lancaster, 2002). 

Todas estas relaciones son explícitas y recíprocas, de modo tal que si el 
término A está relacionado con B, el término B también debe estar relacio- 
nado con A. 


Relación jerárquica 

La relación jerárquica se establece entre dos conceptos. Uno representa 
el género o el todo y se denomina término genérico; la etiqueta que lo prece- 
de es TG. El otro representa la especie, la parte o un ejemplo del anterior y 
se denomina término específico; su etiqueta es TE. Si bien los dos elementos 
de la relación están designados por términos preferentes o formas autorizadas 
del nombre, se encuentran en un distinto nivel de jerarquía. Ejemplo: 


reptiles serpientes 
TE serpientes TG reptiles 


La etiqueta TG puede sustituirse por el símbolo < y la de TE por >. Ejemplo: 


automóviles deportivos automóviles 
< automóviles > automóviles deportivos 
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Las normas y manuales citados permiten, de manera opcional, indicar en to- 
dos los términos preferentes el término tope, es decir, el concepto más gené- 
rico de una cadena de conceptos (Barité et al., 2013). En un tesauro facetado, 
el término tope es la faceta de primer nivel, según se explica en el capítulo 
9. En España y en Cuba el término tope se conoce como término cabecera 
(AENOR, 1990; Oficina Nacional de Normalización, 2000). La etiqueta del 
término tope es TT. En el siguiente ejemplo, los términos preferentes muebles 
de oficina, escritorios, escritorios gerenciales y escritorios secretariales com- 
parten un mismo TT muebles: 


muebles 
TE muebles de oficina 
TE muebles del hogar 


muebles de oficina 
TT muebles 

TG muebles 

TE escritorios 

TE mesas 


escritorios 

TT muebles 

TG muebles de oficina 

TE escritorios gerenciales 
TE escritorios secretariales 


escritorios gerenciales 
TT muebles 

TG escritorios 
escritorios secretariales 
TT muebles 


TG escritorios 


Todos los términos preferentes y las formas autorizadas del nombre de- 


HAS 


ben tener, al menos, una relación jerárquica. Si carecen de una relación je- 
rárquica, se denominan términos huérfanos. Un tesauro no debe tener ningún 
término huérfano. 

De acuerdo con la norma ISO 25964, hay cuatro tipos de relación jerár- 
quica, que se describen a continuación (ISO, 2011). 


Relación jerárquica género-especie 

En este caso, el término genérico es el género y el término específico es 
la especie. También se conoce como relación jerárquica genérica. Es la más 
común de las relaciones jerárquicas y se puede verificar con la prueba que se 
muestra en la Figura 1. 


Figura 1. Prueba de la relación jerárquica género-especie: Algunos motores 
son eléctricos, pero todos los motores eléctricos son motores. Por lo tanto, 
motores es el género y motores eléctricos la especie. 


motores 


algunos todos 


motores eléctricos 





Algunos ejemplos de relación jerárquica género-especie son: 


embarcaciones a vela embarcaciones 

TG embarcaciones TE embarcaciones a vela 
inmigrantes italianos inmigrantes 

TG inmigrantes TE inmigrantes italianos 


Aunque no es obligatorio, se puede agregar a la etiqueta de esta relación una 
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letra G para indicar que es una relación género-especie. En este caso sería 
TGG (término genérico género-especie) y TEG (término específico género- 
especie). Por ejemplo: 


hospitales pediátricos hospitales 
TGG hospitales TEG hospitales pediátricos 


Relación jerárquica todo-parte 

En esta relación, el término genérico representa el todo y el término espe- 
cífico representa una parte de ese todo. También se denomina relación jerár- 
quica partitiva. La norma ISO 25964 solo permite cuatro tipos de relaciones 
todo-parte (ISO, 2011). 


+» Sistemas y órganos del cuerpo 


ventrículos corazón 

TG corazón TE ventrículos 
pulmones sistema respiratorio 
TG sistema respiratorio TE pulmones 


* Lugares geográficos 


Chubut Argentina 
TG Argentina TE Chubut 
Trelew Chubut 
TG Chubut TE Trelew 


* Disciplinas y sus especialidades 


oncología medicina 

TG medicina TE oncología 
oncohematología oncología 

TG oncología TE oncohematología 


+ Estructuras sociales 
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facultades universidades 


TG universidades TE facultades 
parroquias diócesis 
TG diócesis TE parroquias 


También aquí se puede agregar a la etiqueta de esta relación una 
letra P para indicar que es una relación todo-parte. En este caso sería 
TGP (término genérico partitivo) y TEP (término específico partitivo). 
Por ejemplo: 


intestino delgado sistema digestivo 

TGP sistema digestivo TEP intestino delgado 
Facultad de Derecho Universidad de los Andes 
TGP Universidad de los Andes TEP Facultad de Derecho 


Relación jerárquica enumerativa o ejemplar 

En esta relación, el término genérico es el género o el todo y el término 
específico es un ejemplo del anterior, designado por una forma autorizada del 
nombre. Por ejemplo: 


Universidad de Palermo universidades 

TG universidades TE Universidad de Palermo 
Martí, José, 1853-1895 escritores 

TG escritores TE Martí, José, 1853-1895 


La norma internacional ISO 25964 establece que la etigueta opcional 
para la relación jerárquica enumerativa es BTI/NTI broader term (instan- 
tial), narrower term (instantial), pero las normas española, argentina y otras 
latinoamericanas vigentes no la han contemplado todavía (AENOR, 1990; 
Oficina Nacional de Normalización, 2000; ICONTEC, 1998; IRAM, 1983). 
En 2013 el Subcomité de Documentación del IRAM aprobó las etiquetas 
TGE/TEE (término genérico enumerativo y término específico enumerativo) 
para la norma IRAM-ISO 25963 que se encuentra en curso y así se usan en 
esta obra. Por ejemplo: 
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Lanín (volcán, Argentina) volcanes 


TGE volcanes TEE Lanín (volcán, Argentina) 
Atitlán (lago, Guatemala) lagos centroamericanos 
TGE lagos centroamericanos TEE Atitlán (lago, Guatemala) 


Relación polijerárquica 

Es la relación que se establece entre un término preferente y dos o más 
términos genéricos, según el ejemplo que se muestra en la Figura 2. 

Existen dos posiciones respecto a la relación polijerárquica. Algunos au- 
tores seguidores del análisis de facetas consideran que la estructura sistemá- 
tica debe ser monojerárquica, es decir, cada concepto debe tener un solo con- 
cepto genérico. Aplicado al tesauro, significa que un término preferente solo 
puede tener un TG. Este enfoque coincide con el principio de lugar de defi- 
nición única postulado por Farradane (1952) y revalorado más recientemente 
por otros autores (Gnoli, 2007). 


Figura 2. Ejemplo de una relación polijerárquica. El término preferente 
órganos tiene en este caso dos términos genéricos: instrumentos de viento e 
instrumentos de teclado. Es, por tanto, una relación polijerárquica. 


instrumentos musicales 


| 


instrumentos de teclado instrumentos de viento 





organos 


Contrariamente, en la estructura polijerárquica un concepto puede tener 
más de un concepto genérico, es decir, un término preferente podría mos- 
trar más de un TG. Este enfoque está aceptado por las especificaciones de la 
norma ISO 25964, aunque se aclara que solo ocurre en algunos casos y debe 
tener un fundamento lógico (ISO, 2011). Una discusión sobre este tema se 
puede encontrar en el artículo de Miller (1997). 
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Relación asociativa 

Es una asociación conceptual entre dos términos preferentes o formas 
autorizadas del nombre, que no se puede considerar como una relación de 
equivalencia ni como una relación jerárquica. Su reciprocidad es obligatoria 
y su etiqueta es TR (término relacionado). Por ejemplo: 


aviadores aviones 
TR aviones TR aviadores 


La etiqueta TR puede sustituirse por el símbolo -. Por ejemplo: 


acero laminado laminación 
- laminación - acero laminado 


La relación asociativa ofrece una gran libertad para relacionar los con- 
ceptos representados en el tesauro y su potencial ha sido valorado por diver- 
sos autores (Tudhope et al., 2001). 

Las normas y manuales publicados en el siglo pasado señalaban dos tipos 
de relación asociativa: la intracategoría y la intercategoría. Esta diferencia ha 
sido eliminada en la nueva norma internacional ISO 25964 que seguimos en 
el presente trabajo (ISO, 2011). 

Esta norma internacional brinda, sin pretensión de ser exhaustiva, algu- 
nas orientaciones para establecer las relaciones asociativas. 


Una disciplina o campo de estudio y su objeto o fenómeno estudiados. 
Por ejemplo: 


biología seres vivos 

TR seres vivos TR biología 
química fenómenos químicos 
TR fenómenos químicos TR química 


Una operación o proceso y su agente o instrumento. Por ejemplo: 


administración administradores 
TR administradores TR administración 
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procesamiento de datos computadoras 
TR computadoras TR procesamiento de datos 


Una acción y el producto de esa acción. Por ejemplo: 


fotoduplicación fotocopias 

TR fotocopias TR fotoduplicación 
construcción viviendas 

TR viviendas TR construcción 


Una acción y su receptor u objetivo. Por ejemplo: 


curación enfermos 
TR enfermos TR curación 
compra proveedores 
TR proveedores TR compra 


Un objeto o material y sus propiedades. Por ejemplo: 


aluminio maleabilidad 
TR maleabilidad TR aluminio 
vino color 

TR color TR vino 


Un artefacto y sus partes, cuando estos no califican para una relación 
jerárquica todo-parte (véase el apartado 8.1.2). Por ejemplo: 


bicicletas manubrios 
TR manubrios TR bicicletas 
gestión planificación 
TR planificación TR gestión 


Conceptos vinculados por una dependencia causal. Por ejemplo: 


farmacodependencia fármacos 
TR fármacos TR farmacodependencia 
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hábito de fumar cigarrillos 
TR cigarrillos TR hábito de fumar 


Un objeto o proceso y su contraagente. Por ejemplo: 


plagas plaguicidas 
TR plaguicidas TR plagas 
infecciones antibióticos 
TR antibióticos TR infecciones 


Un objeto y su unidad de medida. Por ejemplo: 


voltaje voltio 

TR voltio TR voltaje 

presión atmosférica hectopascal 

TR hectopascal TR presión atmosférica 


Un organismo o sustancia engendrado o derivado de otro. Por ejemplo: 


mulas burros 

TR burros TR mulas 

chicle Manilkara zapota 
TR Manilkara zapota TR chicle 


Un término preferente puede tener todas o algunas de las relaciones se- 
mánticas aquí descriptas. Por ejemplo: 
papas 
UP patatas 
TT tubérculos 
TG tubérculos comestibles 
TE papas amarillas 
papas coloradas 
papas negras 
papines 
TR puré de papas 


- 131 -— 


patatas 
USE papas 


Lo mismo sucede con las formas autorizadas del nombre. Por ejemplo: 


Borges, Jorge Luis, 1899-1986 

NA Comparte el sinónimo colectivo Honorio Bustos Domecq con el au- 
tor Adolfo Bioy Casares. 

TT escritores 

TG escritores argentinos 

TR Bioy Casares, Adolfo, 1914-1999 
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Autoevaluación 
Explique la relación jerárquica. 


¿Qué etiquetas y símbolos indican una relación jerárquica? 
¿Qué tipos de relación jerárquica reconoce la norma ISO 25964? 


¿Qué es un término huérfano? ¿Se pueden aceptar términos huérfanos en un 
tesauro? 


Explique la relación asociativa. 
¿Qué etiquetas y símbolos indican una relación asociativa? 


Mencione en qué casos se recomienda establecer una relación asociativa. 
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9. El orden sistemático del tesauro 


Nos referiremos aquí a las relaciones de macronivel, es decir, al orden 
sistemático del tesauro (Aitchison et al., 2000). Se trata de construir un es- 
quema o plan de organización de los conceptos correspondientes al dominio 
del tesauro. Esos conceptos, designados por los términos preferentes y las 
formas autorizadas del nombre, se agrupan lógicamente de acuerdo con sus 
semejanzas y se separan por sus diferencias, de modo similar a un sistema 
de clasificación. Para lograr este orden sistemático también es indispensable 
cumplir con el principio de garantía, que se explicó en el Apartado 6.6. 


Definición y análisis del dominio 
Un dominio es una esfera o ámbito específico de conocimiento, influen- 
cia O actividad. Puede ser una disciplina, arte o profesión, una especialidad de 
estas o un campo multi o interdisciplinario. Una vez que se ha tomado la deci- 
sión de diseñar un tesauro, el primer paso es definir su dominio con exactitud. 
Tennis (2003) propone dos ejes analíticos para definir un dominio: 
+ Eje 1 - Áreas de modulación: establece la extensión y el nombre del 
dominio. La extensión es el alcance total del dominio, es decir, su cober- 
tura: lo que incluye y lo que no incluye. Por su parte el nombre designa 
al dominio, es la denominación por la cual debe llamarse ese dominio. 
* Eje 2 - Grados de especialización: establece la focalización y la inter- 
sección del dominio. Mediante la focalización, la extensión del domi- 
nio disminuye, mientras que su intensidad aumenta. En otras palabras, 
mientras más restringido sea el alcance del dominio, más profunda será 
su especificidad. Por su parte, la intersección ubica un dominio frente a 
otros dominios. Puede ocurrir que un dominio esté claramente separado 
de otros, o bien que se interseque con alguno, dando lugar a un nuevo 
dominio con un nuevo nombre, como sucede con las interdisciplinas. 
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Una vez definido el dominio del tesauro, es necesario analizarlo. Hjgr- 
land y Albrechtsen (1995) han señalado que la mejor manera de estudiar la in- 
formación o el conocimiento registrado en el área de la BDCI es analizar los 
dominios de conocimiento como comunidades de pensamiento o de discurso 
que son parte de la división social del trabajo. La organización del conoci- 
miento, la estructura, los patrones de cooperación, las formas lingúísticas y 
de comunicación, los SAR y los criterios de relevancia son según los autores 
citados reflejos de los objetos de trabajo de estas comunidades y de su rol en 
la sociedad. 

Barité et al. definen el análisis de dominio de la siguiente manera: 


Denominación genérica de un conjunto de metodologías que tienen como 
objetivo común establecer las fronteras de un espacio especializado del 
saber, y determinar su estructura interna de conceptos y relaciones, con 
el propósito de representar el conocimiento que le es propio a través de 
una estructura conceptual o de otras modalidades. El análisis de domi- 
nio se realiza a partir de la identificación de los problemas y los tópicos 
propios del área, tal como se expresan en su literatura de referencia. Las 
aproximaciones pueden ser cuantitativas, cualitativas y mixtas. Estas 
metodologías se utilizan tanto para elaborar sistemas de organización del 
conocimiento y otras estructuras, como para revisarlas y evaluarlas (Ba- 
rité et al., 2013). 


Entre los métodos aportados por la BDCI para el análisis de dominio, 
Hjorland é: Albrechtsen (1995) mencionan el análisis de facetas que explica- 
remos aquí, los estudios bibliométricos, los estudios de usuarios particular- 
mente de las conductas de búsqueda y algunas ideas de Bliss sobre la identi- 
ficación de la estructura del dominio. 

Por otro lado, en un tesauro hay algunos temas que no forman parte 
del dominio, pero que suelen ser necesarios. Vickery (1960a) los llama 
temas marginales y se debe decidir si se incluyen o no. Si se incluyen, es 
preciso considerar hasta qué nivel de especificidad se deben desarrollar, 
aunque generalmente se opta por un nivel menos específico que aquel del 
dominio. Algunos temas marginales comunes a casi todos los tesauros son 
los siguientes: 
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* Legislación 

+ Historia 

* Educación 

* Investigación 

» Tecnología 

+ Administración 

+ Estadística 

+ Obras de referencia, publicaciones 
+ Bibliotecas, archivos, museos 

+ Sociedades, asociaciones 


Análisis de facetas 

En el capítulo 6 explicamos que el método inductivo es ideal para rea- 
lizar la colecta de términos y nombres propios. Por otro lado, el método de- 
ductivo permite construir el orden sistemático para proceder a distribuir en 
ese esquema los términos y nombres propios colectados. Ambos métodos 
se complementan y la metodología recomendada para esto es justamente el 
análisis de facetas. 

Entonces, el análisis de facetas consiste en organizar los conceptos, de- 
signados por los términos preferentes y formas autorizadas del nombre, en 
facetas homogéneas mutuamente excluyentes, derivadas de un universo co- 
mún (Vickery, 1960a). 

El creador del análisis de facetas fue el bibliotecario y profesor indio 
Shiyali Ramamrita Ranganathan, quien aplicó sus ideas en un sistema de cla- 
sificación de su autoría titulado Colon classification y expuso su teoría en el 
libro Prolegomena to library classification (Ranganathan, 1933, 1937). Des- 
de mediados del siglo veinte, un grupo de expertos británicos —seguidores 
de Ranganathan y reunidos en el CRG— han revisado el método del análisis 
de facetas, aplicándolo a todo tipo de SOC (Broughton, 2011). 


Aislados y focos 

Un concepto que ha sido seleccionado para un SOC pero que aún no ha 
sido incluido en el esquema del orden sistemático, se conoce en el análisis 
de facetas como aislado. Un aislado es, entonces, “un concepto simple que 
puede situarse en varios contextos diferentes, conforme a sus características 
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intrínsecas y que es susceptible de ser incluido dentro de una faceta” (Barité 
et al., 2013). Cuando el aislado se incorpora a una faceta, se convierte en 
un foco. 

Si se aplica a un tesauro, el análisis de facetas consiste básicamente en 
convertir a los aislados en focos, es decir, en organizar los términos preferen- 
tes y las formas autorizadas del nombre en un esquema facetado. 

Siguiendo a Vickery (1960a) y a Mills (1960, 2004), las etapas del análi- 
sis de facetas para un tesauro son: 

» Identificación de las categorías apropiadas para el dominio 

+ División del dominio en facetas amplias 

+ División de cada faceta en subfacetas específicas 

+ Orden de clasificación de las facetas y subfacetas 

+ Adición de una notación 

+ Vinculación con la sección alfabética 


Categorías y facetas 
En el campo de la organización del conocimiento, Barité ofrece la si- 
guiente definición de categorías: 


Son abstracciones simplificadas, con fuerza de herramientas intelectua- 
les, usadas por los clasificacionistas para indagar las regularidades de los 
objetos del mundo físico y del ideal y de las nociones [conceptos] que los 
representan. Este análisis y representación es realizado con miras a orga- 
nizar lógicamente los sistemas de conceptos, suficientes para la organi- 
zación del conocimiento en términos generales y el análisis de materia o 
clasificación de documentos en términos específicos (Barité, 2000b: 5). 


Ranganathan (1967) estableció cinco categorías fundamentales que de- 
nominó personalidad, materia, energía, espacio y tiempo (PMEST). Para 
este autor, las cinco categorías, en ese orden estricto, podían ser aplicadas 
a todos los dominios. Por el contrario, el CRG postuló que las categorías a 
emplear deben surgir del análisis del propio dominio, con lo cual pueden o 
no coincidir de un dominio a otro (Mills, 1960, 2004; Spiteri, 1998; Vickery, 
1960a). No obstante, se reconoce que ciertas categorías aparecen frecuente- 
mente. Aitchison et al. (2000) las resumen como sigue: 
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a) Entidades, cosas, objetos 
(por características) 
Entidades abstractas, por ejemplo: ideas, disciplinas, fundamentos. 
Entidades naturales, por ejemplo: radiación, nubes, ríos. 
Entidades vivas, organismos; por ejemplo: bacterias, virus, mamíferos. 
Artefactos, por ejemplo: manufacturas, obras de arte. 
Atributos, propiedades, cualidades, estados, condiciones; por ejemplo: 
temperatura, color, confiabilidad, tamaño. 
Sustancias materiales, sustancias componentes; por ejemplo: minerales, 
madera, cuero, plásticos, drogas. 
Partes, componentes; por ejemplo: partes del cuerpo, techos, pisos. 
Entidades completas, entidades complejas; por ejemplo: motores de ve- 
hículos, barcos, edificios, escuelas. 

(por funciones) 
Agentes (individuos, personal, organizaciones que realizan una acción), 
por ejemplo: artistas, marineros, médicos, asociaciones profesionales. 
Agentes (equipamiento, aparatos que realizan una acción), por ejemplo: 
herramientas, computadoras, respiradores, lavavajillas. 
Pacientes (receptores de una acción), por ejemplo: víctimas, beneficia- 
rios, audiencias. 
Productos finales, por ejemplo: alimentos, residuos, resultados de la in- 
vestigación. 


b) Acciones, actividades 

Procesos o funciones, por ejemplo: desarrollo, enfermedades, pensa- 
miento, caminata. 

Operaciones, por ejemplo: enseñanza, curación, gerenciamiento. 


c) Espacio 

Espacio geopolítico, por ejemplo: países, provincias, ciudades. 
Espacio geofísico, por ejemplo: ríos, montañas, islas. 

d) Tiempo 


Períodos de duración, por ejemplo: siglos, décadas, años. 
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Recurrimos ahora a un ejemplo que nos permita explicar mejor el aná- 
lisis de facetas. Supongamos que el dominio del tesauro es bibliotecología 
y que hemos analizado las fuentes pertinentes para cumplir con el princi- 
pio de garantía. También hemos identificado y definido algunos conceptos 
relevantes, que hemos designado con ciertos términos. Controlamos ese 
vocabulario inicial y obtuvimos los siguientes términos preferentes, que 
son nuestros aislados. 


bibliotecarios 
DEF Profesionales que ejercen la bibliotecología. 


bibliotecas 

DEF Instituciones que se caracterizan por desarrollar una colección de 
documentos, organizar esa colección y prestar servicios a una comuni- 
dad de usuarios. Cuentan para esto con el aporte de personal directivo, 
profesional y auxiliar. 


catalogadores 
DEF Bibliotecarios que se especializan en el proceso de catalogación. 


directivos 


DEF Miembros del personal que cumplen la función de dirigir la biblioteca. 
empleados 
DEF Miembros del personal que cumplen una función auxiliar en la bi- 


blioteca. 


informáticos 
DEF Profesionales que ejercen la informática. 


licenciados 
DEF Profesionales que poseen el grado académico de Licenciado. 


magisters 
DEF Profesionales que poseen el grado académico de Magister. 
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personal 
DEF Conjunto de personas que cumplen alguna función en la biblioteca. 


procesos 
DEF Conjunto de actividades transformadoras que convierten una entra- 
da (recursos) en una salida (producto, servicio). 


profesionales 
DEF Miembros del personal de la biblioteca cuya función requiere el 
ejercicio de una profesión universitaria. 


recursos 
DEF Conjunto de bienes materiales, financieros y tecnológicos con que 
cuenta la biblioteca para alcanzar sus objetivos y producir sus servicios. 


referencistas 
DEF Bibliotecarios que se especializan en el proceso de referencia. 


servicios 
DEF Productos de la biblioteca que dan respuesta a las necesidades de 


los usuarios y que son el resultado de los procesos. 


usuarios 
DEF Personas u organizaciones que demandan servicios de la biblioteca. 


Ahora bien, al analizar estos conceptos en relación con las categorías 


notamos varias cosas: 


El aislado bibliotecas corresponde a la categoría [entidades complejas], 


ya que se trata de una institución que consta de numerosos elementos (perso- 


nas, bienes, ideas etc.) que deben funcionar en conjunto para el logro de los 


objetivos. 


Los aislados bibliotecarios, catalogadores, referencistas, directivos, em- 


pleados, informáticos, licenciados, magisters, personal y profesionales co- 


rresponden a las personas que cumplen funciones en la biblioteca, es decir, 


que llevan a cabo una acción. Pertenecen por eso a la categoría [agentes]. 
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Notamos también que catalogadores y referencistas comparten el atribu- 
to de ser bibliotecarios. Por su parte, bibliotecarios, informáticos, licenciados 
y magisters son profesionales. Además, profesionales, directivos y emplea- 
dos son miembros del personal. A su vez, personal es el aislado más amplio o 
genérico dentro de la categoría [agentes]. 

El aislado usuarios se refiere a las personas u organizaciones que reciben las 
acciones realizadas por los agentes. Pertenecen entonces a la categoría [pacientes]. 

El aislado procesos es un conjunto de actividades y por ende pertenece a 
la categoría [acciones]. 

El aislado recursos pertenece a la categoría [materiales]. 

El aislado servicios pertenece a la categoría [producto final]. 

Lo que hemos hecho es categorizar, dentro del dominio bibliotecología, 
un conjunto de aislados previamente seleccionados y controlados, que ya han 
sido aceptados con sus respectivos términos preferentes y definiciones. 

El esquema resultante de esta primera etapa del análisis de facetas puede 
observarse en la Figura 1. Las facetas de primer nivel constituyen los térmi- 
nos tope de las relaciones jerárquicas del tesauro. 


Figura 1. Dominio, categorías y facetas. Esquema que muestra el dominio 
(bibliotecología), las categorías por las que se ha analizado ese dominio y 
las facetas resultantes, que constituyen el primer nivel del orden sistemático. 
Nótese que las categorías se indican entre corchetes y con letra cursiva. 
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- bibllotecología — [pacientes] - usuarios 
[materiales] A / recursos 
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Una faceta se define como “el total de subclases que resulta de la aplica- 
ción de una única característica” (Mills, 1960: 8). O también: “conjunto total 
de subdivisiones de un concepto o clase, derivadas del mismo principio de 
división” (Barité et al., 2013). 


Subfacetas y focos 

Seguimos ahora con los demás aislados de la categoría [agentes]. En- 
contramos que tres de ellos directivos, profesionales y empleados comparten 
el atributo de ser miembros del personal y por lo tanto podrían constituir una 
subfaceta de la faceta personal. Por otro lado, los tres conceptos se diferen- 
cian entre sí por la función que cumplen, y tomaremos este atributo como la 
característica de división [por función] (Figura 2). 


Figura 2. Faceta, característica de división y subfacetas. Esquema que 
muestra una faceta (personal), una característica de división [por función] 
y una subfaceta de tres focos (directivos, profesionales, empleados). Nótese 
que la característica de división también se indica entre corchetes y con letra 
cursiva, pero a diferencia de la categoría, se le antepone la preposición por. 


f 


directivos | 
personal — [por función] profecionales | 


| empleados 


Podemos definir ahora tres elementos del análisis de facetas: atributo, 
característica de división y subfaceta. 

Un atributo es una cualidad presente en un objeto. Algunos atributos 
permiten dividir un concepto y otros no. Ranganathan (1967) utilizó el 
siguiente ejemplo: la posesión del rostro es un atributo de los seres huma- 
nos, pero no permite la división porque todos poseemos un rostro, por lo 
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tanto es un atributo que no sirve para obtener conceptos más específicos. 
En cambio, el sexo, la edad, la estatura, el color del cabello son atributos 
que sí permiten la división en conceptos más específicos como varón y 
mujer, jóvenes y viejos, altos y bajos, rubios y morenos. El atributo de un 
concepto, elegido para obtener conceptos más específicos, es una caracte- 
rística de división (ISO, 2011; Ranganathan, 1967) o principio de división 
(Mills, 1960). 

Una subfaceta se define como una “serie de subclases derivadas de una 
clase superior por la aplicación de una única característica” (Vickery, 1960a: 
39). Se trata en definitiva del conjunto de focos que resultan de la aplica- 
ción de una única característica de división. Ranganathan llamó a esto array, 
mientras que el CRG prefirió subfacet. En español se ha traducido como 
hilera, serie, rango o subfaceta, que preferimos aquí (Barité et al., 2013; 
Mills, 1960, 2004; Vickery, 1960a). Todos los focos de una subfaceta tienen 
el mismo nivel jerárquico, por eso la norma ISO 25964, refiriéndose especí- 
ficamente al tesauro, denomina a los focos de una misma subfaceta términos 
hermanos y define subfaceta como el “conjunto de términos hermanos” (ISO, 
2011: 1). 

Continuamos analizando dos aislados más: bibliotecarios e informáticos. 
Ambos comparten el atributo de ser profesionales, pero se diferencian por 
la profesión que ejercen. Entonces, [por profesión] será la característica de 
división usada para ubicarlos en el esquema. Obtendremos así una subfaceta 
de tercer nivel (Figura 3). 

Sin embargo, también encontramos otros dos aislados licenciados y ma- 
gisters cuyas definiciones claramente establecen que son profesionales, pero 
se distinguen uno de otro por el grado académico. Entonces tenemos otra 
característica de división, [por grado académico], que aplicamos también 
a profesionales y obtenemos otra subfaceta de tercer nivel, distinta a la del 
párrafo anterior (Figura 3). 

Es decir, se pueden aplicar una o más características de división a un 
mismo concepto, siempre y cuando cada una de ellas produzca una subfaceta 
con focos homogéneos y mutuamente excluyentes. 

Tomemos ahora los aislados catalogadores y referencistas. De acuerdo 
con su definición, comparten el atributo de ser bibliotecarios y se diferen- 
cian por su especialidad. La característica de división será [por especiali- 


das 


dad]. El resultado es una subfaceta de cuarto nivel, que también se muestra 
en la Figura 3. 


Figura 3. Subfacetas de segundo, tercero y cuarto nivel. Los aislados referi- 
dos a los distintos profesionales han sido organizados por dos características 
de división: [por profesión] y [por grado académico], que resultan en dos 
subfacetas de tercer nivel. A su vez, los aislados referidos a los distintos 
tipos de bibliotecarios han sido organizados según la característica de divi- 
sión [por especialidad] para obtener una subfaceta de cuarto nivel. 
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Una subfaceta debe incluir todos los focos que derivan de la caracte- 
rística de división. Para agotar la división, en un sistema de clasificación 
generalmente se utiliza una clase residual otros. Pero en un tesauro no puede 
haber un término preferente otros. Algunas veces, como afirma Mills (2004), 
se recurre a conceptos expresados por una frase negativa. Por ejemplo, si al 
término preferente bebidas se le aplica la característica de división [por con- 
tenido de alcohol] se obtendrán los términos preferentes bebidas alcohólicas 
y bebidas no alcohólicas. Este último concepto estaría incluyendo todos los 
tipos de bebidas que no son alcohólicas y con esto el nivel de exhaustividad 
de la subfaceta estaría completo. 

Se procede igual con todos los aislados, es decir, con todos los conceptos 
designados por términos preferentes o formas autorizadas del nombre. 


La cadena y las relaciones jerárquicas 


Observemos ahora la Figura 4, donde se muestran todos los niveles del 
esquema referido al ejemplo. 
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Figura 4. Cadena. Esquema que muestra el dominio y las facetas y subface- 
tas, hasta el cuarto nivel. Se distinguen dos cadenas completas: a) personal, 
profesionales, bibliotecarios, catalogadores y 2) personal, profesionales, 


bibliotecarios y referencistas. 














Niveles 


Los términos preferentes personal, profesionales, bibliotecarios y catalo- 
gadores forman una cadena. Los conceptos personal, profesionales, bibliote- 
carios y referencistas forman otra cadena. Entonces, podemos decir que una 
cadena es un conjunto de focos subordinados, derivados de la aplicación de 
distintas características de división. De acuerdo con Barité et al., una cadena es: 


Serie jerárquica de términos de extensión decreciente e intensión cre- 
ciente derivada por subdivisiones sucesivas, producto de la aplicación 
de características cada vez más específicas. El término que se ubica en 
el extremo cenital de una cadena se llama summun genus y corresponde 
al término tope de un tesauro o a la clase de un sistema de clasificación. 
Lo que caracteriza a una cadena es que todos sus términos sin excepción, 
están en relación jerárquica unos respecto de otros (Barité et al., 2013). 


En la sección sistemática de un tesauro, las cadenas de la Figura 9.4 se 
indicarían como sigue (téngase en cuenta que solo se ha desarrollado la ca- 


tegoría [agentes]: 
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[agentes] 


[pacientes] 


personal usuarios 
[por función] [materiales] 
directivos recursos 
profesionales [acciones] 
[por profesión] procesos 
bibliotecarios [producto final] 
[por especialidad] servicios 
catalogadores 
referencistas 
informáticos 
[por grado académico] 
licenciados 
magisters 
empleados 


En una cadena no se pueden saltar los conceptos de nivel intermedio. Por 


ejemplo: 


Cadena incorrecta: 


sistema circulatorio 


Cadena correcta: 


sistema circulatorio 


aurículas corazón 
ventrículos aurículas 
ventrículos 


Etiqueta de nodo 


Como se puede observar en las figuras 9.1 a 9.4, se han indicado entre 
corchetes tanto las categorías como las características de división. La norma 
ISO 25964 llama a esta indicación node label, que se ha traducido al español 
como indicador clasificatorio (AENOR, 1990) y también como etiqueta de 
nodo (ICONTEC, 1998). El Subcomité de Documentación del IRAM adoptó 
etiqueta de nodo para la norma IRAM-ISO 26954-1, cuya preparación se 
encuentra en curso. 

El término etiqueta de nodo se define como “una etiqueta que se inserta 
en el orden sistemático para mostrar cómo han sido ordenados los términos” 
(1SO, 2011: 7). 

La etiqueta de nodo de la categoría se escribe entre corchetes y con letra 
cursiva, mientras que la etiqueta de nodo de la característica de división se 
escribe entre corchetes, con letra cursiva y anteponiendo la preposición por, 
como se observa en las figuras 9.1 a 9.4. 
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El orden de archivo u orden de intercalación 

La metodología del análisis de facetas fue creada inicialmente para los 
sistemas de clasificación, y en ese caso deben completarse dos etapas más: a) 
la definición del orden de cita u orden de mención y b) la definición del orden 
de intercalación. 

En un tesauro no se requiere un orden de mención porque es un SOC 
poscoordinado. Sin embargo, se debe prestar atención al orden de intercala- 
ción. De acuerdo con Mills (1960, 2004) el orden de intercalación tiene dos 
componentes: 

+ Orden de las facetas y las subfacetas: es la sucesión en que las facetas 

y las subfacetas (cada una de ellas considerada como un bloque) se orde- 

nan una tras otra. Este orden se basa en el principio de extensión decre- 

ciente, o, dicho de otra forma, de lo general a lo particular. 

+ Orden de los focos en una subfaceta: se basa en el principio de secuen- 

cia útil de Ranganathan, que se explica en el Apartado 9.3. 


Principios del análisis de facetas 

Como se mencionó anteriormente, la metodología del análisis de facetas 
procede de dos fuentes: Ranganathan y el CRG. Ambos han aportado nume- 
rosos principios que deben observarse cuando se intenta aplicar esta metodo- 
logía al desarrollo de un SOC. 

Ranganathan postuló 46 cánones, 13 postulados y 22 principios que se 
exponen en su libro Prolegomena to library classification. Por un lado, al- 
gunos de estos cánones, postulados y principios resultan reiterativos; por el 
otro, el estilo de redacción de Ranganathan no es fácil de leer. 

El CRG, si bien se basa en los principios de Ranganathan, tiene sus pro- 
pios aportes, particularmente en lo que se refiere a las categorías fundamen- 
tales. Desafortunadamente, el CRG nunca publicó un texto similar a Prole- 
gomena, que reuniera la teoría del análisis de facetas según el enfoque de este 
grupo. Por el contrario, los principios se encuentran dispersos en numerosos 
artículos y otras fuentes. 

Por lo antes expuesto, la profesora canadiense Louise Spiteri propuso com- 
patibilizar los principios de Ranganathan con los del CRG, para simplificar 
su explicación y comprensión. A continuación se describen los principios del 
análisis de facetas de acuerdo con el modelo simplificado de Spiteri (1998). 
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Principios de la característica de división: 

* Principio de diferenciación: una característica de división debe generar 
al menos dos focos mutuamente excluyentes. 

* Principio de relevancia: una característica de división debe ser relevan- 
te para el propósito del tesauro. 

* Principio de averiguabilidad: una característica de división se debe po- 
der averiguar y definir. 

* Principio de permanencia: una característica de división debe continuar 
sin cambios, mientras no se modifique el esquema. 

» Principio de homogeneidad y exclusión mutua: una característica de 
división debe producir focos homogéneos y mutuamente excluyentes, 
es decir, los contenidos de un foco no pueden superponerse con los de 
ningún otro y cada foco debe proceder de una única característica de 
división. 

*» Principio de las categorías fundamentales: no existen categorías fun- 
damentales para todos los dominios. Las categorías deben basarse en la 
naturaleza del dominio a ser analizado. 


Principios del orden de las facetas, subfacetas y focos: 

* Principio de sucesión relevante: la sucesión de características de divi- 
sión debe ser relevante para el propósito del tesauro. 

* Principio de sucesión consistente: la sucesión de características de di- 
visión en el esquema debe mantenerse consistentemente, mientras el es- 
quema no sea modificado. 


Principios de la terminología: 

* Principio del contexto: la denotación de un término debe estar deter- 
minada por las diferentes facetas, subfacetas y focos pertenecientes a la 
misma cadena del término en cuestión. 

* Principio de actualidad: el término usado para designar un foco debe ser 
de uso corriente entre los especialistas del dominio del tesauro. 


Principios de la notación: 


* Principio de sinonimia: la notación debe ser única; no puede haber dos 
notaciones diferentes para un mismo concepto. 
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+ Principio de homonimia: el concepto representado por una notación 
debe ser único; no puede haber dos conceptos representados por la mis- 
ma notación. 

* Principio de hospitalidad: el sistema notacional debe permitir la adición 
de nuevas facetas y focos en cualquier punto del esquema. 


Principios del orden de clasificación: 

+ Los focos en la cadena deben mostrar una extensión decreciente, de lo 
general a lo particular. 

» Los focos en la subfaceta deben ordenarse de acuerdo con alguno 
de los criterios de la secuencia útil expresados por Ranganathan, en- 
tre ellos: complejidad creciente o decreciente, concreción creciente o 
decreciente, cantidad creciente o decreciente, contigijidad espacial (le- 
janía o cercanía en el espacio), orden cronológico (lejanía o cercanía 
en el tiempo), orden evolutivo (lejanía o cercanía del origen), orden 
canónico, etc. De no existir otro criterio más conveniente, se puede 
recurrir al orden alfabético. 


Orden sistemático por campos temáticos 

La norma ISO 25964 acepta la construcción de un orden sistemático por 
campos temáticos en lugar de facetas. Así, un dominio se ordena de acuerdo 
con sus distintas especialidades u otras subáreas aceptadas en ese dominio. 
Por ejemplo, medicina podría dividirse en especialidades como medicina ge- 
neralista, pediatría, gerontología, Gn sus distintas especialidades ginecología, 
inmunología, etc., o por subáreas como anatomía, fisiología, patología. 

La norma también acepta un orden sistemático basado en campos temá- 
ticos que a su vez son subdivididos por facetas. 


Notación 

La notación es un conjunto de símbolos que representan un concepto en 
algunos SOC, especialmente en los sistemas de clasificación (ISO, 2011). 
Los símbolos pueden ser letras, números, signos de puntuación o una combi- 
nación de todos estos. 

En un tesauro, la notación puede servir para dos cosas: 

+ Mecanización: dado que la notación tiene un valor ordinal, facilita la 
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organización de los conceptos del orden sistemático por medio de un 
programa informático. 

+ Nexo: en los tesauros impresos la notación sirve de nexo entre la sec- 
ción alfabética y la sección sistemática. En los tesauros en línea esta fun- 
ción no es necesaria, dado que todos los términos preferentes y las for- 
mas autorizadas del nombre deben estar hipervinculados, de tal manera 
que un simple clic del mouse remita del orden alfabético al sistemático. 


La notación debe reunir ciertas cualidades, que describe Foskett (1996): 
+ Unicidad: cada notación debe representar un concepto y solo uno, evi- 
tando la sinonimia y la homonimia. 

+ Simplicidad: la notación debe ser fácil de comprender, usar y recordar. 
+ Brevedad: la notación debe ser breve. Para ello es necesario que la 
notación de base, es decir, la notación que corresponde a las facetas de 
primer nivel, sea lo más corta posible. Una decisión que se debe tomar 
es si conviene usar números o letras para la notación. Si se opta por los 
números, una base de un dígito podrá albergar hasta 10 facetas (del O al 
9). Para extenderla sería necesario recurrir a una base de dos dígitos (del 
00 al 99) o de tres dígitos (del 000 al 999), lo cual puede producir nota- 
ciones muy extensas. Si se opta por letras, la base de una sola letra podría 
albergar hasta 26 facetas y sería más fácil mantener una notación breve. 
+ Hospitalidad: el sistema de notación debe permitir que en el futuro los 
nuevos conceptos sean acomodados en facetas, subfacetas o focos, sin 
alterar las notaciones existentes. 

+ Expresividad: la notación debe evidenciar el orden sistemático del 
tesauro. 


Según los símbolos utilizados, la notación puede ser de dos tipos (Gil 
Urdiciain, 2004): 

+ Notación pura: utiliza un solo tipo de símbolo, por ejemplo solo núme- 

ros o solo letras. 

+ Notación mixta: utiliza una combinación de símbolos, por ejemplo le- 

tras y números, o letras mayúsculas y letras minúsculas. 


Respecto al orden, también hay dos tipos de notación (Vickery, 1960a): 
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+ Notación jerárquica: indica claramente el orden del esquema de lo 
general a lo particular. Tiene la ventaja de ser expresiva, pero también 
la desventaja de perder brevedad. 

+ Notación ordinal: ordena los conceptos en el esquema, pero no hace 
evidente las jerarquías. No es expresiva, pero ayuda a mantener la 
brevedad. 


En la Tabla 1 se compara un ejemplo de notación ordinal con otro de no- 
tación jerárquica. Nótese que ambos tipos de notación expresan el orden del 
esquema, pero mientras que en la notación jerárquica es fácil de reconocer 
(a notación más corta representa un concepto más general y la notación más 
larga representa un concepto más específico), en la notación ordinal no es 
posible distinguir qué conceptos están subordinados a otros. 


Tabla 1. Comparación de una notación ordinal y una jerárquica 


Sudamérica 





Argentina 





Chaco 





Resistencia 





Barrio España 





Corrientes 






Misiones 





Brasil 12 
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Autoevaluación 

¿Qué se entiende por dominio del tesauro? 

¿En qué consisten los ejes Áreas de Modulación y Grados de Especialización? 
¿Qué es el análisis de dominio? 

¿Qué se entiende por temas marginales? 

¿Cuáles son las etapas del análisis de facetas? 

¿Qué son las categorías? 

¿Cuál es la diferencia entre aislado y foco? 

¿Qué es una faceta? 

Defina atributo, característica de división y subfaceta. 

¿Cuáles son los principios del análisis de facetas? 

¿Qué otros tipos de orden sistemático acepta la norma ISO 25964? 
¿Qué es la notación y para qué sirve en un tesauro? 


Describa las cualidades que debe poseer la notación. 
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10. Evaluación, publicación y actualización 
del tesauro 


Los procesos finales del diseño y desarrollo de un tesauro son la eva- 
luación, la publicación y la actualización. Los explicaremos a continuación. 


Evaluación del tesauro 

La evaluación es el proceso de obtener evidencias para juzgar el grado en 
que se han alcanzado los objetivos y las metas establecidas. En consecuencia, 
la evaluación del tesauro consiste en obtener evidencias para juzgar en qué 
grado cumple con las funciones de indización y recuperación. 

Como afirman Owens y Cochrane (2004), la evaluación de tesauros pue- 
de realizarse por distintos métodos. Por ejemplo, puede ser evaluado por un 
experto, comparado con otros tesauros, contrastado con las normas, probado 
en experiencias reales de indización y recuperación, etc. Con distinta ter- 
minología, Gil Leiva (2008) y Lancaster (2002) reconocen varios tipos de 
evaluación de tesauros, que se presentan en la Tabla 1. 


Tabla 1. Métodos de evaluación de tesauros 


Se evalúa la introducción, ell 
uso de calificadores y notas, 


O Cualitativa reciprocidad de las relaciones, 
Evaluación intrínseca O] formas gramaticales según las 
superficial normas, etc. 





Evaluación por medio de 


Cuantitativa o estadística indicadores 





Comportamiento del 
Evaluación extrínseca | tesauro en la indización y 
la recuperación 


Prueba de indización, tasa del 
precisión y tasa de acierto 

















- 153 — 


Evaluación intrínseca cualitativa 

La evaluación intrínseca cualitativa requiere que un experto o un grupo 
de expertos revise las características del tesauro y las contraste contra la nor- 
ma que se ha seguido. Esta evaluación debe determinar si el tesauro consta 
de una portada, una introducción con todos los elementos que se mencionan 
en el Apartado 10.2.1, si incluye calificadores y notas, si la reciprocidad de 
las relaciones es consistente, si las formas gramaticales, la tipografía y las 
etiquetas utilizadas son las recomendadas, etc. 


Evaluación intrínseca cuantitativa 

La evaluación intrínseca cuantitativa o estadística requiere la aplicación 
de indicadores. 

La experiencia más conocida para la evaluación de tesauros usando indi- 
cadores es la realizada por el Bureau Marcel Van Dijk (BMD) de Bruselas, que 
en 1976 llevó a cabo un estudio sobre 10 tesauros monolingiies y 10 tesauros 
multilingúes (Commission des Communautés Européennes, 1976). El BMD 
propuso varios indicadores que también han sido aplicados por otros autores 
(Álvaro Bermejo et al., 1989a,b), aunque Lancaster (2002) llegó a la conclu- 
sión de que si bien algunos son ingeniosos, otros resultan triviales e incluso ar- 
bitrarios. Por otro lado, hay que tener en cuenta que el BMD basó su evaluación 
en la primera edición de la norma ISO 2788:1974, que fue sustituida por una 
segunda edición hace casi 30 años y recientemente por la norma ISO 25964. 

Nosotros hemos propuesto un conjunto de indicadores, basados en las 
normas publicadas en este siglo veintiuno. Aunque fueron probados en una 
muestra de tres tesauros, la intención ha sido que sean incorporados al soft- 
ware de gestión, de modo que puedan producir informes estadísticos automá- 
ticamente. Los indicadores se describen a continuación (Martínez Tamayo et 
al., 2009, 2011a): 

a. Porcentaje de términos preferentes que designan más de un concepto; 
por ejemplo, el término preferente nombres y códigos identificadores de ob- 
servación lógica del Tesauro Spines. Se define como A/B*100, donde A es el 
número de términos preferentes que designan más de un concepto y B es el 
número total de términos preferentes. El valor de referencia es 0, ya que las 
normas establecen que un término preferente debe designar un solo concepto. 

b. Media de palabras por término preferente. Se define como A/B, donde 
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A es el número de palabras de los términos preferentes y B es el número total 
de términos preferentes. Se expresa como +DE (media + un desvío estándar). 
El valor de referencia es 2,0+1,0, es decir, un rango promedio entre 1 y 3 
palabras por término preferente. Este rango coincide con el estudio realizado 
por Gil Leiva €: Rodríguez Muñoz (1997), quienes para una muestra de 1284 
términos preferentes asignados en bases de datos científicas españolas, iden- 
tificaron un 86% con una, dos o tres palabras. 

c. Porcentaje de términos preferentes con formas gramaticales no espe- 
cificadas por las normas; por ejemplo, el término preferente información/ 
biblioteca, cooperación del Tesauro de la Unesco. Se define como A/B*100, 
donde A es el número de términos preferentes que presentan formas gramati- 
cales distintas a las especificadas por la norma y B es el número total de térmi- 
nos preferentes. El valor de referencia debería ser O, pero como también aquí 
las normas admiten excepciones, se debe asumir que mientras menor sea este 
porcentaje, mayor será el cumplimiento con las recomendaciones de la norma. 

d. Porcentaje de términos preferentes con formas de singular y plural no 
recomendados. Se define como A/B*100, donde A es el número de términos 
preferentes que presentan formas de singular o plural distintas a las especifi- 
cadas por las normas y B es el número total de términos preferentes. El valor 
de referencia es 0, ya que en este caso no hay excepciones. 

e. Porcentaje de términos preferentes que carecen de relación jerárqui- 
ca (términos huérfanos). Se define como A/B*100, donde A es el número 
de términos preferentes que carecen de relación jerárquica y B es el número 
total de términos preferentes. El valor de referencia para este indicador es 0, 
ya que todo término preferente debe tener al menos una relación jerárquica. 

f. Porcentaje de términos preferentes con dos o más términos genéricos. 
Se define como A/B*100, donde A es la suma de términos preferentes que po- 
seen dos o más TG y B es el número total de términos preferentes. Si se aplica 
el concepto de estructura monojerárquica, entonces el valor de referencia de 
este indicador es 0, ya que ningún término preferente puede tener más de un 
TG. Si se aplica el concepto de estructura polijerárquica (véase el Apartado 
8.1.4) no hay un valor de referencia, pero siendo que la norma considera que 
esta situación se produce solo en algunos casos y debe tener sólidos funda- 
mentos lógicos, se asume que mientras menor sea el porcentaje, mayor será 
el cumplimiento con la norma. 
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g. Porcentaje de términos preferentes con un solo término específico. 
Se define como A/B*100, donde A es el número de términos preferentes que 
poseen un solo TE y B es el número total de términos preferentes. El valor 
de referencia para este indicador es 0, ya que en un tesauro no puede haber 
un término preferente con un solo TE, según el principio de diferenciación 
postulado por Ranganathan (véase el Apartado 9.4). 


Evaluación extrínseca 
Finalmente, para la evaluación extrínseca que mide el comportamiento 
del tesauro en la indización y la recuperación se recomienda lo siguiente: 
+ Prueba de indización: consiste en distribuir una edición preliminar del 
tesauro entre un cierto número de bibliotecas especializadas, centros de 
documentación u otras instituciones de la BDCI para una experiencia 
real de indización, durante un período de varios meses. Las instituciones 
participantes deben comunicar todos los errores y fallas que encuentren, 
así como las sugerencias que estimen convenientes, tanto del propio te- 
sauro como de la interfaz. 
+ Prueba de recuperación: las mediciones más conocidas son las tasas 
de precisión y de acierto propuestas por Claverdon y Mills (1985). En el 
resultado de estas mediciones intervienen distintas variables como la ex- 
haustividad y la especificidad de la indización, la interfaz usuario-siste- 
ma, la experiencia de búsqueda de los usuarios finales, etc., pero también 
pueden aplicarse específicamente a la evaluación del tesauro, cuando la 
recuperación se realiza exclusivamente por los términos preferentes y las 
formas autorizadas del nombre (Foskett, 1996; Lancaster, 1995). 


La tasa de precisión ha sido incorporada como indicador en la norma 
TRAM-ISO 11620 (IRAM, 2007). Se define como A/B, donde A es el nú- 
mero de documentos recuperados que son relevantes y B es el número total 
de documentos recuperados en la búsqueda. Es una medida de la capacidad 
del sistema de recuperación para encontrar un documento por un punto de 
acceso determinado, en este caso un término preferente o una forma auto- 
rizada del nombre. 

La tasa de acierto se define como A/B, donde A es el número de docu- 
mentos relevantes recuperados y B es el número total de documentos relevan- 
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tes en la base de datos. Es una medida de la capacidad del sistema de recupe- 
ración para reunir conjuntos de documentos que respondan a un determinado 
punto de acceso, por ejemplo, un término preferente o una forma autorizada 
del nombre. 

Entre la tasa de precisión y la de acierto existe una relación inversamente 
proporcional, es decir, a mayor precisión, menor acierto y a mayor acierto, 
menor precisión. En general, se privilegia la precisión. 

Los tipos de evaluación que se han mencionado no son excluyentes, sino 
complementarios: se pueden aplicar todos o algunos al mismo tesauro y de 
hecho conviene que así se haga. 


Cuándo realizar la evaluación 

Hay dos momentos en los que debe haber una evaluación del tesauro por 
parte del equipo de trabajo responsable de su diseño y desarrollo: 

+ Una primera evaluación antes de publicar la primera edición, como se 

indicó más arriba. 

» Periódicamente para su actualización, teniendo en cuenta además las 

sugerencias, comentarios y quejas que los indizadores y los usuarios fi- 

nales hayan hecho llegar. 


Los métodos de evaluación sugeridos aquí también se pueden aplicar a 
un tesauro cuando se necesita considerar su adquisición, pero esta evaluación 
obviamente es realizada por terceros. Resulta muy útil que quienes efectúan 
este tipo de evaluaciones hagan conocer los resultados a los miembros del 
equipo de trabajo responsable del tesauro. 


Publicación del tesauro 

La publicación del tesauro puede ser impresa o digital. Hasta hace algu- 
nos años, la mayoría de los tesauros se publicaban impresos en papel, pero en 
la actualidad se cuenta con numerosos tesauros digitales, muchos de ellos dis- 
ponibles en la Web. La tendencia, por supuesto, es propiciar la incorporación 
de tesauros en línea y que esta sea la forma de publicación habitual. La norma 
ISO 25964 refleja esta tendencia, en contraposición con las normas anteriores 
que ponían el énfasis en la publicación impresa (1SO, 2011). 

Cualquiera sea el tipo de publicación, los componentes del tesauro son: 
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* Portada o página de inicio: identifica al tesauro con la mención del títu- 
lo, los nombres de los creadores y colaboradores, el número de edición, 
la editorial, el lugar y la fecha de publicación, el ISBN, DOI, etc. 

+ Tabla de contenido: debe enumerar todas las secciones del tesauro y 
remitir a estas mediante hipervínculos. Si el tesauro está disponible en 
la Web, la tabla de contenido puede presentarse en una tabla lateral o 
en solapas. 

+ Introducción: debe brindar, tanto al indizador como al usuario final, la 
información que se detalla en el Apartado 10.2.1. 

*» Sección sistemática: como su nombre lo indica, despliega el orden sis- 
temático del tesauro. Debe estar hipervinculada con la sección alfabética. 
+ Sección alfabética: muestra los términos preferentes y no preferentes, 
así como las formas autorizadas y variantes del nombre, en una secuencia 
alfabética. Debe estar hipervinculada con la sección sistemática. 


Introducción del tesauro 

La introducción del tesauro tiene como propósito informar, tanto al indi- 
zador como al usuario final, los aspectos que se mencionan a continuación, 
en lo posible con abundantes ejemplos ilustrativos: 

+ El dominio del tesauro, su alcance y los temas marginales. Conviene 

mencionar a qué tipo de institución, usuarios finales y documentos está 

destinado. 

+ Los idiomas en que se presenta. 

* Indicación de la norma que se ha seguido para desarrollarlo. 

+ El significado de todas las convenciones, abreviaturas, etiquetas y sig- 

nos de puntuación empleados en él. 

+ El número de términos y nombres propios, discriminados por términos 

preferentes y no preferentes, formas autorizadas y variantes. 

+ La fecha de incorporación del último término o nombre propio. 

+ Las reglas o criterios empleados en la selección de los conceptos, la 

selección y redacción de los términos y nombres propios. 

* La política de actualización, incluyendo la frecuencia, las fechas y los 

procedimientos pertinentes, así como el nombre y domicilio del respon- 

sable a donde deben enviarse los comentarios y sugerencias. 

+ Referencias a las fuentes utilizadas en la compilación del tesauro, así 
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como los agradecimientos a las personas y organizaciones ajenas al equi- 
po multidisciplinario que han colaborado con el tesauro. En este sentido, 
es necesario contar con el permiso escrito de las personas u organizacio- 
nes a mencionar en tales agradecimientos. 


Registros individuales de términos y nombres propios 


Para cada término preferente o forma autorizada del nombre se debe ge- 
nerar un registro individual, que debe mostrar los siguientes datos en el mis- 
mo orden que se presenta: 


término preferente o forma autorizada del nombre 
CC Notación o código de clasificación 

NA Nota de alcance 

UP término no preferente 

TT término tope 

TG término genérico 

TE término específico 

TR término relacionado 

DEF Nota de definición 

NH Nota histórica 

CM Categoría a la que se asigna el concepto 


Tomando nuevamente el ejemplo del capítulo 9, se tendría: 


profesionales 

CC 220 

NA Úsese para obras que tratan sobre los profesionales universitarios 
en general. Para obras sobre los profesionales que ejercen una profesión 
específica, úsese el término que designe esa profesión, por ejemplo, 
bibliotecarios, informáticos. 

UP profesionistas 

TT personal 

TG personal 

TE bibliotecarios 
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TE informáticos 

TE licenciados 

TE magisters 

DEF Miembros del personal de la biblioteca, cuya función requiere del 
ejercicio de una profesión universitaria. 

NH Incorporado el 30-11-2013 

CM Agentes 


Por otra parte, el tesauro debe desplegar también las relaciones de equi- 
valencia desde un término no preferente o una forma variante del nombre al 
respectivo término preferente o forma autorizada del nombre. Por ejemplo: 


Profesionistas Drabenstott, Karen 
USE profesionales USE Markey, Karen 
Tipografía 


Existe cierta libertad en cuanto a la tipografía que debe emplearse, pero 
se recomienda diferenciar claramente los términos preferentes de los no pre- 
ferentes y las formas autorizadas del nombre de sus formas variantes. No obs- 
tante, la norma ISO 25964 sugiere las siguientes pautas (véanse los ejemplos 
del Apartado 10.2.2): 

+» El término preferente y la forma autorizada del nombre se deben escri- 

bir con letra regular (ni cursiva, ni negrita). 

» El término no preferente y la forma variante del nombre se escriben con 

letra cursiva. 

* Las etiquetas de las relaciones (USE/UP, TG/TE, TR/TR) de las notas, 

de la notación y de la categoría de materia se indican en mayúscula com- 

pacta y negrita. 

+ La etiqueta de nodo, como ya se mencionó, se indica en letra cursiva y 

entre corchetes. Cuando se refiere a la característica de división, se antepo- 

ne la preposición por; no así cuando se trata de la categoría. Por ejemplo: 

Categoría: [agentes] 

Característica: [por función] 

+ Los términos preferentes y no preferentes se escriben en minúsculas, 

incluyendo su letra inicial. Se exceptúan aquellos casos que incluyen 


- 160 — 


obligatoriamente una letra mayúscula. Por ejemplo: 


biólogos 

D-alanina transaminasa 
novelas policiales 

pH 


En las formas autorizadas y variantes del nombre se usará mayúscula 
solo para las letras iniciales, como indica la gramática española; el resto de 
las letras en minúscula. Por ejemplo: 


Misiones (Argentina) 
Torre Nilsson, Leopoldo, 1924-1978 
Universidad de Buenos Aires 


+ No conviene usar las mayúsculas compactas o en bloc para resaltar el 
término preferente o la forma autorizada del nombre porque dificultan la 
lectura; por ejemplo: 


plaguicidas y no PLAGUICIDAS 


* Las siglas se exceptúan de la instrucción anterior, ya que deben escribir- 
se en mayúscula compacta y sin punto, de modo que puedan recuperarse 
como una palabra: 


CONICET 
SIDA 
UNESCO 


+ Cuando los términos van acompañados de números, letras griegas o signos 
de puntuación, estos deben respetarse. Las letras griegas se escriben como 
una palabra para facilitar la indización y la recuperación. Por ejemplo: 
cadena beta de alfa-cristalina 

molécula 1 de adhesión intercelular 

N-acetil muramoil-L-alanina amidasa 


- 161 — 


receptor erbB-3 
xilano endo-1,3-beta-xilosidasa 


Secciones sistemática y alfabética 

En la Figura 1 se muestra un ejemplo de la sección sistemática corres- 
pondiente al ejemplo que hemos venido desarrollando. 

La sección sistemática no requiere indicar las relaciones de equivalencia 
O las relaciones asociativas, sino solamente el orden sistemático completo 
que incluye las relaciones jerárquicas entre términos preferentes o entre estos 
y las formas autorizadas de los nombres (Aitchison et al., 2000; Gil Urdi- 
ciain, 2004; ISO, 2011; Lancaster, 2002; Naumis Peña, 2008). 


Figural. Ejemplo de la sección sistemática del tesauro. La jerarquía se 
muestra con TE1, TE2, TE3. Además, cada nivel de la jerarquía se puede 
expandir [+] o contraer [-]. La interfaz corresponde al software TemaTres. 


Ejemplo 





personal 





| le! Lo! B o a ra] 0 a A 
Autor Ana María Martnes 


IE! 





Una forma novedosa de presentar la sección sistemática del tesauro es a 
través de un mapa de tópicos como el que se muestra en la Figura 2. 


—- 162 — 


Figura 2. Orden sistemático en forma de mapa de tópicos.' Al marcar una 
etiqueta se abren los términos más específicos 





ALL AA 


Search for Topics Topics: 57753 am] 19 a] 17] 


Por otra parte, es conveniente que cuando se despliegue el registro indi- 
vidual de un término preferente o forma autorizada del nombre, se muestre 
también la cadena jerárquica, como se observa en la Figura 10.3. 

Por su parte, la sección alfabética, como su nombre lo indica, muestra los 
términos preferentes y no preferentes, más las formas autorizadas y variantes 
de los nombres, siguiendo la secuencia alfabética. Bajo cada término prefe- 
rente O cada forma autorizada del nombre se debe desplegar toda la infor- 
mación incluida en el registro individual, como se mencionó en el Apartado 
10.2.2. A su vez, bajo cada término no preferente y cada forma variante del 
nombre debe aparecer el reenvío al término preferente o a la forma autorizada 
del nombre que corresponda. 

No está de más reiterar que todos los términos preferentes y las formas 
autorizadas del nombre deben estar hipervinculados con sus correspondien- 
tes términos no preferentes y formas variantes del nombre, así como con sus 
respectivos términos genéricos, específicos y relacionados. 


* Consulte la versión interactiva en http://highwire.stanford.edu/hti¡/HWTree.html?catid=0. 
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Figura 3. Ejemplo de registro individual de un término preferente. La 
flecha indica la cadena Inicio ,, personal ,, profesionales ,, bibliotecarios ,, 
catalogadores. Esta cadena pertenece a la faceta personal. Nótese también 

la nota de alcance, el término genérico y el término relacionado. La interfaz 
corresponde al software TemaTres. 


Ejemplo 





catalogadores 
pe nal » profe nale » bit teca » catalogadores MAÁAÁAÁáAáAáAáAIAAXAOZ 


Nota de alcance: 


Bibliotecarios que se especializan en el proceso de catalogación 


TG 


catalogadores 
TR 


Fecha de creación: 01-Nov-2013 
Término aceptado: 01-Nov-2013 


BSET2IS DC MADS SKOS-Core VDEX XTM Zihes JSON JSONLO n2a:xO0d22 


O le] o] El 1] El [mm] e! Ir] URt: http//knoc.com.artunipv10/ 
Autor: Ana María Martinez 


Generado por TemaTres 1,64 





español ” 


Un tesauro debe vincular la parte alfabética con la sistemática, de modo 
que tanto el indizador como el usuario final puedan comprobar qué lugar ocu- 
pa un término o un nombre propio en el sistema de conceptos representado en 
él. En un tesauro impreso era obligatorio que cada término preferente o cada 
forma autorizada del nombre tuvieran una notación, porque esta servía de nexo 
entre ambas secciones. En cambio, en un tesauro electrónico el nexo entre 
las dos secciones está dado por los hipervínculos o enlaces correspondientes. 
Por otro lado, algunos tesauros impresos incluían un índice permutado para facilitar 
la búsqueda de un término o nombre propio particular. En un tesauro digital esto 
tampoco es necesario, porque se sustituye por el casillero de búsqueda, que puede 
localizar cualquier palabra sin importar si se trata de la primera o alguna posterior. 
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En el Apéndice B de este capítulo se muestran varios ejemplos de tesau- 
ros electrónicos. 


Actualización del tesauro 

Como ya se mencionó, el tesauro necesita una revisión permanente de los 
términosynombrespropios y delajuste correspondientedelasrelacionesylaubi- 
caciónen el ordensistemático, conelfindeagregarnuevostérminos, eliminarlos 
obsoletos y modificarlosqueexijandeterminadoscambios, segúnseanecesario. 
El tesauro digital y en línea tiene la gran ventaja de que las actuali- 
zaciones pueden estar disponibles en forma inmediata para indizado- 
res y usuarios finales, o al menos acortar los tiempos de actualización. 
Es de granutilidad para el equipo de trabajo ofrecerla posibilidadtantoalosindi- 
zadores como alos usuarios finales que utilicen el tesauro, de enviar sus críticas, 
comentarios o sugerencias, para lo cual se puede incluir un formulario especial. 
De esta manera, se contará con un valioso aporte para la futura actualización. 
El equipo de trabajo debe mantenerse activo, más allá de la publicación de la 
primera edición, para actualizarla periódicamente. 
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Autoevaluación 

¿En qué consiste la evaluación del tesauro? 

Explique los tipos de evaluación que se han descripto para el tesauro. 
¿En qué momento debe evaluarse el tesauro? 

¿Qué secciones debe contener un tesauro? 

Indique los aspectos que no deben faltar en la introducción de un tesauro. 


¿Qué tipografía sugiere la norma de tesauros para los términos, nombres pro- 
pios y etiquetas de relación? 


¿Qué información debe presentarse bajo un término preferente o una forma 
autorizada del nombre? 


¿Qué información se incluye en la sección alfabética del tesauro? 


¿Qué información se incluye en la sección sistemática del tesauro? 
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Apéndice B: Ejemplos de tesauros electrónicos 


Figura B1. Interfaz de búsqueda del Tesauro AGROVOC.? 





Focd aerd Agrcaltaso > 
a Search Terms in the AGROVOC Thesaurus 


Qu eu 9 ira dire AGROVOS Trenes. Trpo e oc ape is re er Un vd 





loe 
Pen A Errar me Sescchila: Sub poca es 
4 Torre 
Oper hrs . 
Feglan . A] 
ca mo Freno Crencos 
he Loros numa (se dr ad. 
== Arise Cormron name ta Docena 
Agro appear Choere 
Show 
vecs 
O Current Tena 
VIST Vocatagantas olabid Tier 
ALI Terra 
Meladra 
Tapia 
Diustirgerih Crd tn ontarirglast O ecctmatrr erat aer 
Lbed Daño 
Comerty hash hy word maiz o q cede 


El tesauro es publicado por la Organización de las Naciones Unidas para 
la Alimentación y la Agricultura. Nótese el carácter multilingiie del mismo, 
que obliga a marcar el idioma (Spanish). También puede elegirse el tipo de 
término que se desea buscar (todos los términos, acrónimos, compuestos quí- 
micos, nombres comunes de animales y bacterias, etc.). Se puede buscar por 
los términos en uso o por aquellos que han sido eliminados. Permite elegir si 
la expresión de búsqueda utilizada es la palabra inicial, final, contenida en el 
texto o exacta. Finalmente, se encuentra el casillero de búsqueda en el que se 
ha indicado maíz como término a buscar 


?http://aims.fao.org/es/agrovoc 


—- 167 — 


Figura B2. Lista alfabética de términos del Tesauro AGROVOC 
que incluyen la palabra maíz. 


Results from Term Description: 


e Usstha En ton to s6s the hlerarchy of the corresponding term 


e Usethe button to see more information on the correspondina term 
Code Term Status 5cope 
12332 Maiz (ES Descriptor + E 
7152 Malzamilara (ES Descriptor + NS 
22788  Muizarrugado (ES Non-Descriptor +T 
Aalz azucarado [ES NorDescriptor + E 
238 Aaiz blando (ES NonrrDescriptor + E 
123 Descriptor + E 





7 C + E 
po criptor + "E 
A 14 Non Descelatar + E 
11739 Mairdela india (ES Non-Descriptor + E 
A108 Malzde palomitas (ES) Descriptor + 
22789 Muizderosetas (ES Non-Descriptor +E 
22/90 Maizderositas (ES NonrrDescriptor +E 
2197  Maizdentado (ES Descripto + E 
2 Maizdulce (ES Descriptor + E 


Nótese lo siguiente: a) en la primera columna aparece el código o no- 
tación de cada término; b) en la segunda columna, los términos ordenados 
alfabéticamente; c) en la tercera columna, el estatus del término (descriptor 
o no descriptor); y d) en la cuarta columna aparecen dos opciones: el botón 
+ permite ver el registro individual del término preferente, mientras que el 
botón E remite al orden sistemático. Los términos descriptor y no descriptor, 
de larga historia, se encuentran muy difundidos. Sin embargo, la norma ISO 
25964 ha considerado más adecuados término preferente y término no prefe- 
rente, respectivamente. 
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Figura B3. Registro individual de un término preferente en el Tesauro 


AGROVOC. 
Labots Status Scope Created Last modifiod 
Vocabularies 
Metadata 
Toots 
Linked Dota Word Tree 
Cotrnundy J 25486 - this terr 


Questions and Answers 


Abowt AIMS NT mis e AE 


RT Almidón de m 


Descriptions 


t 


En la parte superior aparece el término preferente en español Maíz 
(ES); a continuación, el estatus indicando que se trata de un descriptor o 
término preferente, no tiene nota de alcance (SN) y las notas históricas in- 
dican la fecha de alta y la última modificación, que en este caso coinciden. 
Luego se despliegan todas las relaciones: a) UF (used for) para la relación 
de equivalencia, con la aclaración de que no hay equivalencias en espa- 
ñol; b) BT (broader term o término genérico) que en este caso es Cereales 
(ES); c) luego aparecen varios NT (narrower terms o términos específicos) 
y finalmente d) los RT (related terms o términos relacionados). No hay des- 
cripciones adicionales para este término preferente, pero podría haberlas 
para otros términos. 
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Figura B4. Despliegue del orden sistemático del Tesauro AGROVOC. 


Í] sitios sugeridos |] Galería de Web... () Importado del.. | Nueva pestaña 8 Vocabulario: 








E 
AgroTagger 
Vochiench Language: Spanish [5] Search 
VEST; Vocobularkes 
Metadata * * * BT Productos (A E+ 
e. e ET Product rigen vegatal (8171) E + 

crac * BT Ciurmales (1474) E+ 
Liskod Data Malz (12332) + 

* NT Malzamilaceo (7152) E + 
S y * NT Malzceroso (8337) E + 
Questions and Answers * NT Maisdepatomitos 16108) E + 

* NT Malzdentado (2187) "E + 

piu * NT Malzdulce (7552) E + 

* NT Maleduro (2974 E + 

* RT Almidón de maiz 

* RT Harina de malz 

. RT Zea mayo 


e 





Hacia arriba del término preferente Maíz se incluye el término genéri- 
co inmediato, en este caso Cereales (ES), y los términos superiores a este. 
Cada punto indica un nivel más alto de especificidad en el orden siste- 
mático. Por debajo del término preferente Maíz se incluyen los términos 
específicos (NT) y relacionados (RT). Los términos genéricos y específicos 
ofrecen la posibilidad de marcar el botón E para continuar navegando por 
el orden sistemático, o bien la opción + para ir directamente al registro 


individual del término. 
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Figura B5. Interfaz de búsqueda del Tesauro SPINES.* 





y E da 
ME E /— OE 
rad mias Durcal O ino 


Tesauro SPINES 


Busqueda 08 Un lécrune de f0rma Dacia O completa 


Buscar óeneo || impar 
La vúsqueda es sensicie a osabquier pno daribos 
De puedo UIC Lario eN mais cutat como en reryrculas 
El cacácter de suitiucón es el % 


Ljerpos 34 tusguesas cara el Mrmiera “ANERRACICAES CROMOSOAMCAS pen 


ARANA CACIONES 
MORDUOSOINICASN 
aABWcoimosircas 
AAERO Ms mc 
ADERRALICAR E CALCIO 


Acceso Gemtato Resutalda yn bdo 194 pisguezas psrcisles per carbctas de pUIIUOIO Y la Er FADEAA ALOPALICIA E N d 
comesronderte de Cel ro 
ORACIÓN 
ABERRACIONES CROMO 
Portadas Careto CROMOSOUCAS 


Este tesauro ha sido elaborado por la Unesco y su versión en línea y 
en español es gestionada por el Instituto de Estudios Documentales sobre 
Ciencia y Tecnología del Consejo Superior de Investigaciones Científicas de 
España. Como se puede apreciar, cuenta con un casillero de búsqueda para 
localizar el término que interesa al usuario. También se pueden marcar, en 
las pestañas que aparecen en la parte superior de la interfaz, tanto la sección 
alfabética como la sección sistemática o jerárquica. 


3http://thes.cindoc.csic.es/buscar_form_esp.php?thes=SPIN 
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Figura B6. Sección sistemática del Tesauro Spines. 


Cota Tete Ó inmcro HS 
Eostat 


Buscar 


Teemaros Hi ¿eras famMico Eúrgueis 


EI CINDOC 


e Tesauro de Spines 





Se puede navegar a través del orden sistemático del tesauro abriendo o 
cerrando los botones + o -. Así, la faceta de primer nivel Economía. Desa- 
rrollo económico y social puede abrirse en un segundo nivel de especificidad 
que incluye, entre otros, el término preferente Desarrollo. Este a su vez puede 
abrirse en un tercer nivel de especificidad en el que se encuentra Desarrollo 
industrial. Finalmente, este se abre en un cuarto y último nivel que incluye 
dos términos preferentes: Cambio interindustrial e Industrialización. No to- 
das las jerarquías cuentan con cuatro niveles, ya que puede haber algunas con 
menos o más niveles de especifidad. Un clic en cualquiera de los términos 
remite al registro individual del término preferente. 
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Figura B7. Sección alfabética del Tesauro SPINES. 


A 





ElNEDCYT 


a 
12ABCODEFGHIIKLUNÑOPORSTUVAAYZ 


Listado altabetido Os lerrrinos [410]  ¡no- SIDO e 
Prisa] jartecon 56 RG IOI 120 15 1 lena] Fl 


DESARROLLO DE TEORÍAS 
DESARROLLO DE TESAUROS 
DESARROLLO DE. AO 

OE TARROLLO ECONÓMICO 
DESARROLLO ECONÓMICO Y SOCIAL 
OUSARROLLO LMUISONAMO 
DÍ SARROLLO ENDÓGIMO: 
DESARROLLO EXPERIMENTAL 
DESARROLLO EXPLORA "ORD 
DESARROLLO HSICO 
DESARROLLO IMDIVICIJAL. 
DESARROLLO INDUSTRIAL 
DESARROLLO INTEORAL 
CESARRRLO MMC aa, 
DESARROLLO INTERMACIONAL 





Nótese en la parte superior el índice A/Z. La lista muestra una parte de la 
página 10 de la letra D, en la que se encuentra el término preferente Desarro- 
llo industrial. Los términos en negrita son los preferentes, mientras que los no 
preferentes se indican en letra cursiva. También aquí un clic en cualquiera de 
los términos remite al registro individual del término preferente. 
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Figura B8. Registro individual de un término preferente en el Tesauro SPINES. 
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PIDUSTRIAL CEVELOPMENT 
DEMELOPPELENT OUT TALL 


El término preferente Desarrollo industrial se resalta en color azul. Se 
incluye un término genérico (TG) y dos términos específicos (TE), así como 
numerosos términos relacionados (TR). Aunque no han sido necesarios en 
este caso, el tesauro también muestra las notas de alcance (NA) y los tér- 
minos equivalentes (UP). Por último, reenvía a los equivalentes en inglés y 
francés, ya que se trata de un tesauro multilingiie. 


1742 


Figura B9. Interfaz del Tesauro de OIT.* 
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Este tesauro es gestionado por la Organización Internacional del Trabajo. 
Nótese el índice A/Z que constituye la sección alfabética del tesauro. Deba- 
jo de este índice aparecen tres opciones: términos tope, huérfanos (que no 
deberían existir) y las categorías por las que se ha analizado el dominio. El 
tesauro es multilingie, de modo que en el casillero de búsqueda se ha indica- 
do el idioma para buscar el término Bibliotecario. Más abajo se puede ver la 
leyenda “Resultados de búsqueda para Bibliotecario” 


% http://www.ilo.org/thesaurus/defaultes.asp 
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Figura B10. Registro individual de un término preferente en el Tesauro de OIT. 
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Nótese la categoría a la que pertenece el término (SC), el término genéri- 
co (BT), los términos relacionados (RT) y las equivalencias en francés (FRE) 
e inglés (ENG). Por último se muestra la nota histórica (última actualización). 
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Figura B11. Interfaz del Tesauro europeo de educación.” 


Tesauro Europeo de la Educación 





Fecha de creación 22-Feb-2007 
Término aceptado: 31-Dic- 1969 
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Es gestionado por la Comisión de las Comunidades Europeas. Directa- 
mente, la página de inicio proporciona la lista sistemática, que muestra las 
distintas categorías bajo las cuales se han ordenado los términos preferentes. 
En forma horizontal se dispone de la lista alfabética A/Z. En la parte superior, 
aparece el casillero de búsqueda y se brinda acceso a la búsqueda avanzada y 
a la información del tesauro. 


5http://www.vocabularyserver.com/tee/es/index.php 
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Figura B12. Registro individual de un término preferente en el Tesauro 
europeo de educación. 


Tesauro Europeo de la Educación 





Lista sistemática 
, » 01 enseñanza y formación 
Cespañor [>] » 02 aprendizaje 
+ D3 principios de educacior 
» 04 sistema de enseñanza 
» 05 sdministración de la educación 
» 00 evaluación 
» 07 edificio 
» 08 equipo 


009 programa de estudios 


» 10 contenido de la educación 
» 11 ciencias y tecnologia 
45 


» 12 ciencias sociales 


» 13 ciencias del lenguaje 


Nótese en la parte superior la cadena correspondiente al término. Luego, 
en la pestaña Término, aparecen el término preferente resaltado en negrita, 
los términos genéricos (TG), los términos específicos (TE), los términos rela- 
cionados (TR) y las equivalencias en los otros idiomas del tesauro. Las notas 
y los metadatos se visualizan en pestañas separadas. 
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11. El tesauro y la interoperabilidad 


En la actualidad y gracias a la Web, existe la posibilidad de que un sis- 
tema de recuperación pueda incorporar una función de búsqueda distribuida, 
es decir, una búsqueda simultánea en múltiples fuentes, cualquiera sea su lo- 
calización. Sin embargo, este tipo de búsqueda por lo general se encuentra li- 
mitada a la lengua natural, de modo que el usuario enfrenta los problemas de 
sinonimia y homonimia que se explicaron en el capítulo 2. A esto debe agre- 
garse la dificultad que presenta la búsqueda distribuida cuando el contenido 
de los documentos se encuentra en distintas lenguas, como ocurre en la Web. 

Por otra parte, muchos sistemas de recuperación también requieren inter- 
cambiar los registros bibliográficos de bases de datos desarrolladas previa- 
mente con total independencia. Tales bases de datos suelen estar indizadas 
con distintos SOC, de modo que necesitan compatibilizarse, tanto en lo con- 
ceptual como en lo terminológico, mediante alguna forma de interoperabili- 
dad (Martínez Tamayo et al., 2011b; Neelamegan €z Lalitha, 2013). 

La interoperabilidad se define como “la habilidad de dos o más sistemas 
para intercambiar información y usar la información que ha sido intercambia- 
da” (ISO, 2013: 7). Así, la interoperabilidad entre SOC se propone armonizar 
las equivalencias y las relaciones jerárquicas y asociativas entre los concep- 
tos de dos o más SOC, con el fin de intercambiar esos conceptos. Un tesauro 
puede interoperar con otro tesauro, con una lista de epígrafes, un sistema de 
clasificación o cualquier otro SOC (Aitchison et al., 2000; Chang €: Zeng, 
2002a,b; Lancaster, 2002; Martínez Tamayo et al., 2011b; Neelamegan €: 
Lalitha, 2013). 

Esta compatibilidad entre SOC no es una novedad. Ya en 1939 la cono- 
cida lista de encabezamientos de materia de Sears asignó a cada epígrafe una 
notación de SCDD, haciendo ambos SOC compatibles (Miller 8: Bristow, 
2007). En las décadas de 1970 y 1980 se llevaron a cabo diversos proyectos 
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de este tipo (Aitchison et al., 2000; Lancaster, 2002). Para 1995 el tema había 
adquirido tal importancia que la ISKO organizó en Varsovia el Seminario 
sobre Compatibilidad e Integración de Sistemas de Ordenación, que culminó 
con una serie de recomendaciones tanto para la investigación, la educación y 
el intercambio de información, como para el desarrollo de sistemas y esfuer- 
zos cooperativos (ISKO, 1996). 

En este siglo veintiuno, la disponibilidad de tesauros y otros SOC en lí- 
nea, así como los recursos que ofrece la tecnología informática, han facilitado 
numerosos y variados proyectos de interoperabilidad entre SOC. En conse- 
cuencia, las nuevas normas de diseño y desarrollo de tesauros han dedicado 
buena parte de sus recomendaciones a la interoperabilidad (BSI Group, 2005- 
2008; ISO, 2013; NISO, 2010). 


Modelos estructurales de interoperabilidad 

La norma ISO 25964-2 describe distintos modelos de interoperabilidad 
entre SOC que, si bien se presentan por separado para facilitar la explicación, 
en la práctica suelen superponerse o combinarse (ISO, 2013). 

Unidad estructural: en este modelo, todos los SOC participantes compar- 
ten exactamente los mismos conceptos y las mismas relaciones jerárquicas y 
asociativas. En cambio, los términos pueden variar, por ejemplo, cuando se 
trata de dos o más SOC en distintos idiomas. 

Vinculación directa: este modelo vincula dos o más SOC que no compar- 
ten la misma estructura. Además de diferenciarse en el alcance, el idioma y la 
estructura, la vinculación puede incluir distintos tipos de SOC, por ejemplo 
un tesauro con un sistema de clasificación o con una lista de epígrafes. Debe 
establecerse un mapeo directo entre los conceptos de un SOC y aquellos de 
cada uno de los otros SOC. El modelo puede extenderse a cualquier cantidad 
de SOC y todos los SOC pueden usarse para la búsqueda en una colección 
indizada con cualquiera de los otros SOC (Figura 1). 

Estructura central o hub: en lugar de establecer un mapeo directo entre 
cada par de SOC, se elige un SOC como hub o SOC central, hacia el cual se 
mapea cada uno de los otros SOC, de modo que cada concepto en el hub debe 
ser mapeado al correspondiente concepto de los otros SOC y viceversa, pero 
no entre todos los SOC. La interoperabilidad se establece entre cada SOC y 
el hub (Figura 2). 


- 180 — 


Figura 1. Modelo de interoperabilidad de vinculación directa. Cada uno de 
los SOC vinculados es compatible con todos y cada uno de los demás SOC. 





Figura 2. Modelo de interoperabilidad de estructura de hub. El SOC B es 

el hub. Cada uno de los otros SOC se vincula con el hub, pero no con los 

demás SOC. Es decir, para vincular el SOC A con el SOC C, es necesario 
pasar a través del SOC B que es el hub. 





Mapeo selectivo: en algunos casos no es necesario mapear la totalidad 
de los SOC, sino solamente una parte de ellos. Hay dos opciones: mapear el 
área que se superpone o mapear solamente los términos preferentes que se 
han usado en la indización (Figura3). 
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Figura 3. Modelo de interoperabilidad de mapeo selectivo. Arriba: solo se 
mapean los conceptos superpuestos o que forman la intersección del SOC A 
y del SOC B. Abajo: se mapean los términos del SOC A usados realmente 
en la indización y los términos del SOC B. 


AB 


indización 





El primer modelo —el de unidad estructural— se recomienda para un te- 
sauro multilingiie nuevo, donde cada concepto es designado por un término 
preferente en cada una de las lenguas y donde las relaciones jerárquicas y aso- 
ciativas son las mismas. Por el contrario, los demás modelos se recomiendan 
para mapear SOC existentes y de distinto tipo, porque al ser diseñados indepen- 
dientemente, los conceptos y relaciones pueden no coincidir de manera exacta. 

El método para lograr la interoperabilidad es el mapeo, es decir, el pro- 
ceso de establecer relaciones entre los conceptos de un SOC y los conceptos 
de otro SOC. El mapeo es más complicado cuando los SOC involucrados son 
de diferente tipo, particularmente entre un SOC poscoordinado y un SOC 
precoordinado, ya que en este último es necesario descomponer primero las 
cadenas precoordinadas. 

La interoperabilidad ocurre entonces entre dos o más SOC, que pueden 
ser de dos tipos según su función: 

+ SOC fuente: es el SOC que sirve como punto de partida cuando se bus- 

ca un término o concepto correspondiente en otro SOC. 

+ SOC blanco: es el SOC en el que se encuentra un término o concepto 

correspondiente a un término o concepto del SOC fuente. 
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Mapeo equivalente 

El punto crítico de la interoperabilidad es la equivalencia, pues no es posible 
establecer jerarquías y asociaciones si no se han establecido primero las equiva- 
lencias entre términos. Se debe diferenciar entre a) la equivalencia intra-SOC, que 
se explicó en el capítulo 7 y b) la equivalencia inter-SOC que se describe aquí. 

Esta equivalencia inter-SOC se establece entre las designaciones de los 
distintos SOC, es decir, entre los términos preferentes y las formas autorizadas 
del nombre. Por ejemplo, en el tesauro A el término preferente es batata y en el 
tesauro B es boniato, o bien en el Tesauro A la forma autorizada del nombre es 
Cortázar, Julio y en el Tesauro B es Cortázar, Julio, 1914-1984. También pue- 
den estar en distinta lengua, por ejemplo guarderías y créches, Suiza y Suisse. 

En otros casos el concepto de un SOC se designa con un término, mien- 
tras que en el otro SOC se designa con dos o más. Por ejemplo en el Tesauro 
A el término preferente es políticas de salud y en el Tesauro B se requieren 
dos términos preferentes: políticas + salud. 

Un término puede representar un concepto en un tesauro y otro concepto 
diferente en un segundo tesauro. Por ejemplo, un tesauro de fotografía puede 
incluir el término preferente diafragma para referirse al dispositivo que re- 
gula la cantidad de luz que ha de pasar en las cámaras fotográficas, mientras 
que un tesauro de acústica puede tener el término preferente diafragma para 
referirse al dispositivo que transforma las vibraciones del sonido en impulsos 
eléctricos o viceversa en algunos aparatos de sonido como el micrófono. 

Hay entonces distintos tipos de equivalencia inter-SOC, que se indican 
con la etiqueta EQ: 

+ Equivalencia simple: el SOC blanco contiene un concepto idéntico al 

concepto del SOC fuente, permitiendo un inmediato mapeo uno-a-uno. 

Un ejemplo: el término preferente enseñanza secundaria del Tesauro de 

la Unesco y la notación 373.5 de CDU. Otros ejemplos: 


SOC fuente SOC blanco 
jardinería EQ 635 
computadoras EQ computadores 
computadoras EQ ordenadores 
maní EQ amendoim 
Países Bajos EQ Deutschland 


- 183 — 


En la equivalencia simple se distinguen dos grados de equivalencia exac- 
to e inexacto que se indican con los símbolos = y >, respectivamente. 

Equivalencia exacta: en un mapeo equivalente, la equivalencia es exac- 
ta cuando el término preferente del SOC fuente y el término preferente del 
SOC blanco designan el mismo concepto y pueden usarse indistintamente. 
Por ejemplo: castañas de cajú =EQ anacardos. 

Equivalencia inexacta: en un mapeo equivalente, los términos prefe- 
rentes considerados equivalentes no siempre son exactamente lo mismo. La 
equivalencia entonces es inexacta. Por ejemplo: bibliotecología “EQ biblio- 
teconomía. 

+ Equivalencia compuesta: un concepto complejo que ha sido designado 
en el SOC fuente por un único término preferente puede estar expresado 
en el SOC blanco por una combinación de dos o más términos. Se produ- 
ce así un mapeo uno-a-muchos. Por ejemplo: el epígrafe de la lista AR- 
MARC administración de fábricas es equivalente a la precoordinación 
de dos términos preferentes del Tesauro de la Unesco: administración + 
fábrica. Cuando en un mapeo selectivo se convierten términos de indiza- 
ción, todos los términos preferentes del SOC blanco deben aplicarse al 
registro indizado con el término del SOC fuente. En la búsqueda deben 
combinarse con el operador booleano AND. El símbolo usado es la adi- 
ción (+). Por ejemplo: 


SOC fuente SOC blanco 
políticas de salud EQ políticas + salud 
economía doméstica EQ economía + hogar 
ciencia y tecnología EQ ciencia + tecnología 
gestión de museos EQ gestión + museos 
autos de competencia EQ autos + competencias 


+ Equivalencia compuesta por intersección: debe su nombre a que es 
posible representarla gráficamente como una intersección de conjuntos. 
Ocurre cuando el concepto del SOC blanco tiene un alcance más general 
que el concepto en el SOC fuente. Se establece una relación del tipo re- 
envío ascendente. Por ejemplo, el término preferente isomerasa de pepti- 
dilprolil del DeCS y el término preferente isomerasas del Tesauro Spines, 
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que no cuenta con términos más específicos. Este tipo de equivalencia 
no es reversible, pues el término general también puede abarcar otros 
conceptos específicos. Por ejemplo: 


SOC fuente SOC blanco 
bibliotecas públicas EQ bibliotecas 
papa blanca EQ papas 

perros de caza EQ perros 
automóviles deportivos EQ automóviles 
Jujuy EQ Argentina 


+ Equivalencia compuesta acumulada: es aquella en la que un concepto 
complejo del SOC fuente equivale a la suma o conjunto de dos o más 
conceptos del SOC blanco. Por ejemplo: el término preferente corrientes 
de agua del Tesauro Spines equivale a la suma de los epígrafes aguas | 
canales | ríos | cataratas (hidrografía) de la lista ARMARC. Cuando en un 
mapeo selectivo se convierten términos de indización, todos los términos 
preferentes del SOC blanco deben aplicarse al registro indizado con el 
término preferente del SOC fuente. En la búsqueda deben combinarse 
con el operador booleano OR. El símbolo de la barra vertical (|) debe 
indicarse entre los términos preferentes del SOC blanco. 


SOC fuente SOC blanco 

transportes EQ aviones | barcos | trenes | automotores 

escuelas EQ escuelas públicas | escuelas privadas 

jóvenes EQ mujeres jóvenes | varones jóvenes 

frutos secos EQ nueces | castañas | avellanas | maníes 

flores EQ flores de jardín | flores silvestres 
Mapeo jerárquico 


El mapeo jerárquico se establece cuando un concepto es claramente más 


general que el otro. Al igual que la relación jerárquica en un tesauro, la rela- 


ción entre los conceptos de distintos SOC puede ser del tipo género-especie o 


enumerativa. La relación todo-parte también puede mapearse jerárquicamen- 


te, en las circunstancias limitadas que describe la norma ISO 25964-1. 
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El mapeo jerárquico de un concepto específico a un concepto genérico 
se expresa con el formato: amebas BM protozoos. El mapeo jerárquico re- 
cíproco es protozoos NM amebas. BM significa broader mapping o mapeo 
genérico, mientras que NM significa narrower mapping o mapeo específico. 
Dado que no existe todavía una norma de interoperabilidad entre tesauros en 
español, en esta obra se ha decidido mantener las etiquetas en inglés. 


Mapeo asociativo 

El mapeo asociativo se establece cuando los conceptos de dos o más 
SOC no califican para el mapeo equivalente o jerárquico, pero están asocia- 
dos semánticamente. La etiqueta para este mapeo es RM (related mapping). 
Por ejemplo, alcohol RM alcoholismo y alcoholismo RM alcohol. Al igual 
que en el caso anterior, dado que no existe todavía una norma de interope- 
rabilidad entre tesauros en español, en esta obra se ha decidido mantener las 
etiquetas en inglés. 

La norma ISO 25964-2 aclara que la línea divisoria entre el mapeo aso- 
ciativo y la equivalencia inexacta es difícil de definir y subjetiva, por lo cual 
recomienda hacerlo pragmáticamente de acuerdo con el contexto en el que 
se usará el mapeo. 


Tesauros multilingiles 

Un tesauro multilingúe es aquel en el que cada concepto debe estar repre- 
sentado por igual en todas las lenguas incluidas, es decir, todos los idiomas 
son tratados en igualdad de condiciones. Ejemplos de este tipo son los tesau- 
ros del sistema de la ONU, entre ellos el Tesauro de la Unesco, el Tesauro de 
la OIT, el de UNBIS, AGROVOC, etc. 

La metodología para tratar un tesauro multilingúe es una forma de in- 
teroperabilidad. Las recomendaciones específicas provienen de dos fuentes: 
la norma ISO 25964-1/2 (ISO, 2011; 2013) y las directrices de IFLA para 
tesauros multilingiies (IFLA, 2009a). 

Cuando todos los conceptos del tesauro multilingúe se expresan con un 
término en cada idioma y comparten las relaciones jerárquicas y asociativas, 
se dice que es un tesauro simétrico. Lo ideal por supuesto es un tesauro multi- 
lingúe simétrico, pero no siempre es posible, ya que puede haber variaciones 
de un idioma a otro y de hecho se han identificado varios problemas que 
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suelen presentarse. En tal caso, se trata de un tesauro asimétrico. 
Antes de continuar, es necesario definir dos términos: 
* Lengua fuente: es la lengua que sirve como punto de partida en la tra- 
ducción de un término o en la búsqueda de sus equivalencias. 
* Lengua blanco: es la lengua que proporciona la traducción o el equiva- 
lente de un término que existe en una lengua fuente. 


Problemas frecuentes 

A continuación se presentan los problemas más comunes en los tesauros 
multilingúes. En los ejemplos, la lengua se indica en negrita y de acuerdo al 
código de dos letras para idiomas de la norma ISO 639-1: en = inglés, es = 
español, fr = francés, it = italiano, pt = portugués (ISO, 2002). 

El término en la lengua fuente posee un calificador que no es necesario 
en la lengua blanco: 


Lengua fuente en cranes (birds) 


en cranes (lifting equipment) 


Lengua blanco es grúas 


es grullas 


+ El término en la lengua fuente tiene sinónimos, pero no en la lengua 
blanco. Se respeta la situación sin imponer sinónimos en el tesauro de la 
lengua blanco. 


Lengua fuente es computadoras 
UP computadores 
UP ordenadores 


computadores 
USE computadoras 


ordenadores 


USE computadoras 
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Lengua blanco en computers 


+ El término en una de las lenguas no tiene equivalente en la otra. Se 
recomiendan tres soluciones: 


a. Transformar el término preferente (mercadotecnia) en un término no 
preferente. 


Lengua fuente en marketing 

Lengua blanco es mercadotecnia 
UP marketing 

Solución es marketing 


UP mercadotecnia 


b. Importar el término de la lengua fuente como término prestado de la 
lengua blanco. 


Lengua fuente fr pret-a-porter 


Lengua blanco es pret-a-porter 


C. Crear un neologismo o término acuñado en la lengua blanco. 
Lengua fuente en scanner 
Lengua blanco es escáner 


Presentación del tesauro multilingúe 

En la presentación de un tesauro multilingúe, los idiomas deben identi- 
ficarse con el código ISO de idiomas ya mencionado (ISO, 2002). Se debe 
seguir el formato del siguiente ejemplo (1SO, 2011): 


- 188 — 


Versión en inglés tomato 
es tomate 
it pomodoro 
UF Solanum lycopersicum 


Versión en español tomate 
en tomato 
it pomodoro 
UP jitomate 


UP Solanum lycopersicum 


Versión en italiano pomodoro 
en tomato 
es tomate 


UP Solanum lycopersicum 


Nótese que la versión en español del ejemplo anterior tiene un sinónimo 
más (jitomate) que las otras versiones. Esto es así porque la cantidad de si- 
nónimos y cuasi sinónimos de un término varía de una lengua a otra. En un 
tesauro multilingúe no se requiere la equivalencia entre los términos no pre- 
ferentes de las distintas lenguas. 


Algunas experiencias de interoperabilidad con tesauros 

Sin pretender ser exhaustivos, a continuación se presentan algunas expe- 
riencias de interoperabilidad entre uno o varios tesauros, o entre un tesauro 
y otro tipo de SOC. 


Entre dos o más tesauros 

+ CATAGROVOC: este proyecto compatibiliza el Tesauro Chino de 
Agricultura (CAT) y el tesauro multilingúie AGROVOC de la FAO 
(Liang et al., 2005). 

» ASESG: es un proyecto del Centro de Ecosistemas Acuáticos del Ins- 
tituto de Investigación y Tecnología Agropecuaria de Cataluña. La in- 
teroperabilidad se ha establecido entre cinco tesauros que abarcan las 
ciencias acuáticas, pesca, agricultura, alimentación, medio ambiente y 
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economía (Reverté € Sebastiá, 2009). 

+ Unified Astronomy Thesaurus (UAT): es un proyecto coordinado por 
la American Astronomy Society para crear un tesauro colaborativo con 
el fin de compatibilizar varios tesauros independientes de astronomía y 
astrofísica. En el proyecto participan asociaciones profesionales, socie- 
dades científicas, editores, bibliotecarios y curadores con experiencia en 
el dominio y en tesauros adicionales (Accomazzi et al., 2014). 

* Thesaurus of GT'S: es un proyecto realizado por profesionales de China 
y los Países Bajos, quienes han creado un tesauro multilingije en siete 
idiomas sobre las escalas de los tiempos geológicos (Ma et al., 2011). 


Entre tesauros y listas de epígrafes 

* LECSH-ERIC: es un trabajo experimental realizado en OCLC para pro- 
bar la metodología de trabajo Open Archives Initiative Protocol for Me- 
tadata Harvesting (OAI-PMH). La metodología se aplicó al tesauro de 
ERIC y a la lista de epígrafes LCSH (Vizine Goetz et al., 2004). Esta 
metodología también ha sido descripta en Argentina (Ferreyra, 2009). 

» SWD-IZ: el objetivo de esta experiencia alemana ha sido relacionar los 
conceptos indizados en dos bases de datos, una que indiza con el Thesau- 
rus Sozialwissenschaften de ciencias sociales y otra que utiliza la lista de 
epígrafes Schlagwortnormdatei (SWD) (Zhang, 2006). 


Entre tesauros y sistemas de clasificación 

* Proyecto HILT. Es un proyecto llevado a cabo por el Centre for Digital 
Library Research de la University of Strachclyde en Gran Bretaña. El 
objetivo es lograr un mapeo de diversos tesauros en inglés, usando como 
hub SCDD (Mcgregor et al., 2007; McCulloch € Macgregor, 2008; Ni- 
cholson, 2002; Nicholson £ McCulloch, 2006). 

* Proyecto KoMoHe: es un proyecto del Bundesministerium fiir Bildung 
und Forschung de Alemania, iniciado en 2004 y concluido en 2007. En 
total se vincularon 25 SOC (16 tesauros, 4 listas de términos, 2 listas de 
epígrafes y 3 sistemas de clasificación, incluyendo SCDD), de 11 disci- 
plinas, en alemán, inglés y ruso (Mayr €x Petras, 2008, 2009). 

* Multilingual Thesaurus of Education: es un proyecto piloto realizado 
en la India. Vincula un tesauro en inglés, derivado del esquema de edu- 
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cación de la Colon Classification (CC), y diversas lenguas locales (tamil, 
kannada, tulu, malayalam, punjabi, hindi, sánscrito), a las cuales se pien- 
sa agregar el urdu y el árabe. El proyecto incluye además las notaciones 
de CC y SCDD (Neelamegan é: ¡Lalitna, 2013). 

+ ERIC-TEE-CDU: es un estudio experimental realizado en la Universi- 
dad de Barcelona, que estableció la equivalencia entre los términos pre- 
ferentes del tesauro ERIC en inglés y el Tesauro Europeo de Educación 
(versión en catalán), con notaciones de CDU (Granados Colillas € Nico- 
lau, 2007, 2008). Se trata de un mapeo selectivo, basado en la indización. 
+ ASC-CDU: es un proyecto realizado en la biblioteca del Afrika-Studie- 
centrum (ASC) de Leiden, Holanda, entre 2001 y 2006. Cada término 
preferente del tesauro de ASC tiene asignada una notación de CDU, con 
lo cual se abre la posibilidad de establecer más adelante la conexión con 
otros tesauros, usando CDU como hub (Doorn €: Polman, 2010). 

* BiblioPhil: es un proyecto de interoperabilidad realizado en la Biblio- 
teca Centralá Universitará de Bucarest, Rumania, que ha derivado un 
tesauro trilingiie (rumano, inglés y francés) a partir de las clases de CDU 
(Fráncu 8z Sabo, 2010). Los términos preferentes en las tres lenguas que- 
dan así vinculados a las notaciones. 

* STITCH. Entre 2006 y 2007, las bibliotecas nacionales de Holanda 
y Francia (Koninklijke Bibliotheek o KB y Bibliotheque Nationale de 
France o BNF) llevaron a cabo este proyecto con el fin de hacer interope- 
rables el sistema de clasificación Iconclass, con el que se clasifica la base 
de datos de manuscritos medievales de la KB, y el tesauro Mandragore 
con el que se indiza otra base de datos sobre el mismo tema en la BNF 
(Angjeli 8: Isaac, 2008a,b). 

+ VISION: es un sistema experimental desarrollado en China, que consis- 
te en una red integrada formada por la fusión de un tesauro y un sistema 
de clasificación en un nuevo SOC denominado Clasificación y Tesauro 
Chinos. Este SOC ha sido aplicado a los registros bibliográficos de la 
biblioteca de la Universidad de Beijing (Wang, 2003). 


Tesauros y ontologías 


Algunos tesauros han sido usados como base para crear ontologías y por 
este motivo se consideran lenguajes de transición. Las relaciones en una on- 
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tología son más formales que en un tesauro, y en general se considera que el 
tesauro requiere una reingeniería tanto estructural como conceptual para ser 
reusado o tratado como una ontología, pero puede ser la base para su desarro- 
llo (Kless et al., 2012). 


Dificultades de la interoperabilidad entre SOC 

Lancaster (2002) ha señalado los principales problemas de la interopera- 
bilidad entre SOC: 

1. Nivel de especificidad 

2. Nivel de precoordinación 

3. Solapamiento de términos 

4. Falta de normalización 

5. Grado de actualización de los SOC 


Para solucionar los primeros tres problemas, Tennis (2004) ha propuesto 
focalizar la investigación en el concepto como unidad de conocimiento, la 
materia como cuerpo de ideas organizado o sistematizado y el orden sistemá- 
tico facetado. Con respecto a la normalización, hoy es un problema resuelto 
con la nueva norma de diseño y desarrollo de tesauros ISO 25964 (ISO, 2011, 
2013). En cuanto a la actualización, es obvio que si uno de los SOC que inte- 
ropera no se actualiza más o menos al mismo tiempo que los otros, será muy 
difícil mantenerlos interoperables. 

Además, existen algunas dificultades metodológicas, pues si bien los mé- 
todos informáticos resultan efectivos cuando se trata de mapear términos en 
el área de las ciencias duras, en otros campos —como las ciencias sociales— 
se necesita recurrir al trabajo intelectual de los expertos para establecer el 
correspondiente mapeo (Lauser et al., 2008). 
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Autoevaluación 

En el contexto de los SOC, defina el término interoperabilidad. 
Explique los distintos modelos de interoperabilidad. 

¿A qué se llama SOC fuente y SOC blanco? 

Señale cómo se establece el mapeo equivalente. 

¿Qué etiqueta indica una equivalencia inter-SOC? 

Describa los distintos tipos de equivalencias inter-SOC. 

Señale cómo se establece el mapeo jerárquico. 

¿Qué etiquetas indican una relación jerárquica inter-SOC? 
Señale cómo se establece el mapeo asociativo. 


Explique por qué un tesauro multilingúe se debe tratar como una forma de 
interoperabilidad. 


¿Qué problemas se pueden presentar en el diseño de un tesauro multilingie? 
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12. Software de gestión, modelo de datos 
y formatos de intercambio 


En capítulos anteriores hemos hecho hincapié en la necesidad de presen- 
tar los tesauros en línea. Este capítulo está dedicado a las recomendaciones 
básicas de la norma ISO 25964-1/2 para el software de gestión de la base de 
datos del tesauro, el modelo de datos y los formatos de intercambio, así como 
a algunas referencias al desarrollo automático de tesauros (ISO, 2011, 2013). 


Software de gestión 

Un tesauro debe gestionarse como una base de datos. Hay programas 
adecuados para este fin, como TemaTres, que ha sido desarrollado en Argen- 
tina y aplicado a más de cien SOC en distintos idiomas. Otros software de 
este tipo han sido evaluados y comentados en la Web.* 

También se puede diseñar la base de datos del tesauro utilizando los si- 
guientes formatos de autoridades: 

+ MARC 21 format for authority data, desarrollado por Library of Congress. 


+ UNIMARC manual authority format, desarrollado por IFLA. 


Ambos formatos incluyen los campos necesarios para el término preferen- 
te, las relaciones de equivalencia, jerárquicas y asociativas, las equivalencias 
en otras lenguas, así como la notación de un sistema de clasificación si se desea 
hacerlo compatible con el tesauro (Library of Congress, 2013; Willer, 2009). 

Los requisitos funcionales de FRSAD también aportan lo necesario para 
desarrollar una lista de autoridades de materia, que puede aplicarse perfecta- 
mente al diseño de un tesauro. Como se mencionó en el capítulo 3, FRSAD 
es un modelo conceptual para datos de autoridades de materia, desarrollado 
por IFLA y adecuado para implementar bases de datos relacionales, que ha 


Y http://www.willpowerinfo.co.uk/thessoft.htm 
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establecido dos superclases thema y nomen cuyos atributos y relaciones son 
los siguientes (IFLA, 2010): 
* Thema: los atributos son el tipo de thema y la nota de alcance; las rela- 
ciones son las jerárquicas y las asociativas. 
+ Nomen: los atributos son tipo de nomen, SOC, fuente de referencia, 
representación, idioma, escritura del nomen, escritura de conversión, for- 
ma del nomen, tiempo de validez, audiencia y estatus. La relación es la 
de equivalencia. 


La norma ISO 25964 describe las recomendaciones básicas para el programa 
informático de gestión del tesauro, que pueden resumirse como sigue (ISO, 2011): 
+ Capacidades: el programa debe contar con capacidad de almacenamien- 
to, gestión, importación, exportación y edición de datos, así como de bús- 
queda, visualización y navegación. Es conveniente que pueda gestionar 
más de un tesauro, en uno o más idiomas. Debe permitir la incorporación, 
modificación y eliminación de términos y nombres propios candidatos, 
términos preferentes y no preferentes, formas autorizadas y variantes del 
nombre, notas, notaciones, relaciones semánticas y niveles jerárquicos. 
* Limitaciones: el programa no debe tener limitaciones respecto al núme- 
ro de caracteres de los términos y nombres propios, notas, etiquetas, etc. 
Tampoco debe limitar la cantidad de términos, de relaciones por término 
o de los niveles jerárquicos, y debe facilitar la inclusión de facetas, subfa- 
cetas y etiquetas de nodo. Debe establecer automáticamente las recipro- 
cidades correspondientes a las relaciones semánticas del tesauro. 
* Validación: el programa debe validar todas las relaciones de modo que 
no haya en el tesauro ni términos huérfanos, ni relaciones sin la debida 
reciprocidad. También debe verificar que cada concepto esté representa- 
do por un solo término preferente o una sola forma autorizada del nom- 
bre, así como la ortografía. 
* Vinculación: es indispensable que el programa permita vincular la base 
de datos del tesauro con la base de datos bibliográfica que será indizada y 
consultada con dicho tesauro, de modo tal que tanto el indizador como el 
usuario final puedan operar con ambas bases de datos simultáneamente. 


También se recomienda que sea compatible con los modelos de datos 
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apropiados para incluir un tesauro en la Web, como SKOS o MADS. 


Modelo de datos 

Un modelo de datos es un lenguaje que describe representar y usar los 
datos en una base de datos. En el caso del tesauro, proporciona la descripción 
genérica de su estructura y su semántica. 

La norma ISO 25964-1 recomienda un modelo diseñado de acuerdo 
con las convenciones del lenguaje unificado de modelado (UML o unified 
modelling language). Contiene cinco clases principales que son: Thesaurus, 
ThesaurusArray, ThesaurusConcept, ThesaurusTerm y Note, así como otras 
clases subsidiarias de estas. También indica el carácter obligatorio u opcional 
de los datos y sus posibles ocurrencias (repetibles, no repetibles). El mode- 
lo UML propuesto por ISO y su correspondiente esquema XML se pueden 
encontrar en el sitio que NISO ha dedicado a esto: http://www.niso.org/sche- 
mas/iso25964/schema-intro/. 


Formatos de intercambio 
Además del modelo propuesto por la norma ISO, deben tenerse en cuenta 
los formatos de intercambio como el Metadata autority description schema 





(MADS) de Library of Congress y el Simple Knowledge Organization System 





(SKOS), que es un formato elaborado por el W3C para la Web Semántica, es 
decir, para ordenar el caos de la Web . 

SKOS ha sido desarrollado específicamente para expresar cualquier SOC 
incluidos los tesauros de forma tal que sus datos puedan intercambiarse en- 
tre distintas aplicaciones informáticas y publicarse en la Web (W3C, 2009). 
Además, SKOS se ha mapeado con el modelo FRSAD de IFLA (Zeng €: 
Zummer, 2009a,b). En SKOS los datos se expresan como tripletas RDF (su- 
jeto-predicado-objeto) y pueden codificarse usando cualquier sintaxis RDF, 
por ejemplo RDF/XML. El Resource Description Framework (RDF) es un 
marco de especificaciones para representar información en la Web. El eXten- 
sible Markup Language (XML) es un lenguaje de marcado para almacenar 
datos e intercambiar información estructurada. 

En SKOS, un SOC cualquiera es concebido como un esquema de con- 
ceptos. Tanto el esquema de conceptos como cada uno de los conceptos que 
lo integran se reconocen por un identificador uniforme de recursos (URI o 
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Uniform Resource Identifier), que consiste en una cadena de caracteres que 
identifica inequívocamente un recurso Web, de modo que cualquiera pueda 
referirse al esquema o a cada uno de los conceptos sin ambigúedad. Este URI 
facilita que los conceptos SKOS puedan reusarse en otros esquemas y que se 
facilite el mapeo entre dos o más esquemas, por lo que SKOS resulta ideal 
para la interoperabilidad entre SOC. 

A cada concepto SKOS se le puede asignar una o más etiquetas léxicas, 
en cualquier idioma o escritura. También se pueden asignar notaciones y 
documentar notas de alcance, de definición, históricas o de edición. Un 
concepto SKOS puede vincularse a otro concepto SKOS mediante relacio- 
nes semánticas de equivalencia, jerarquía y asociación. Además, los con- 
ceptos SKOS pueden agruparse en colecciones como las etiquetas de nodo 
o las categorías. 

El vocabulario de SKOS se resume en la Tabla 1. En la Figura 1 se pre- 
senta un ejemplo tomado del Tesauro de la Unesco, marcado con SKOS. 


Tabla 1 Resumen del vocabulario del modelo SKOS 





skos:Concept Concepto 
Conceptos y esquemas | skos:ConceptScheme Esquema de conceptos 
de conceptos skos:inSheme Concepto en un esquema 


skos:hasTopConcept Concepto tope 








skos:prefLabel Término preferente 
Etiquetas léxicas skos:altLabel Término no preferente 
skos:hiddenLabel Término oculto 
skos:broader Concepto genérico 
skos:narrower Concepto específico 
Relaciones semánticas | skos:related Concepto relacionado 


skos:broaderTransitive | Relación jerárquica transitiva 
skos:narrowerTransitive| Relación jerárquica transitiva 





skos:note Nota 
skos:scopeNote Nota de alcance 
skos:historyNote Nota histórica 

Notas documentadas | skos:changeNote Nota por modificación 
skos:definition Nota de definición 
skos:editorialNote Nota de los editores 
skos:example Nota de ejemplo 
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Colección de conceptos 
skos:Collection Colección ordenada de 
, skos:OrderedCollection | conceptos 
Colecciones En 
skos:member Concepto en una colección 
skos:memberList Concepto en una colección 
ordenada 








Figura 1. Modelo de concepto SKOS tomado del Tesauro de la Unesco.? Se 
ha resaltado lo siguiente: en rojo el concepto (skos:Concept) con su corres- 
pondiente URI. En azul el término preferente (skos:prefLabel) en los cuatro 
idiomas del tesauro: inglés, francés, español y ruso. En lila las relaciones 
jerárquicas (skos:narrower y skos:broader). En verde las relaciones asociati- 
vas (skos:related). En violeta las relaciones de equivalencia (skos:altLabel) 
en los cuatro idiomas. 


<rdf:RDF xmins:rdf="http://www.w3.org/1999/02/22-rdf-syntax- 

ns£” xmins:skos="http://www.w3.org/7004/02/skos/core2”> 

<skos: Concept rdf:about="http://skos.um.es/unescothes/C00525”> 
<skos;prefl abel xmi:lang="en*">Catalogung</sicos:preflabel> 
Labelxeniidang="1r >Catalogage</skos: prelLabel> 

abel xmiilang="es">Catalogaci ¿skos:pret cl> 

ko moflabel xml lang=" ru" >Karanoruaimponamme</skos:proflabel> 
<skos:inScheme rdf:resource="http://skos.um.es/unescothes/CS000”/> 
<skos:narrower dl resource="http;/ fx os un esfunescothes/C00367"/5 
<skos:broador cdf: resource ="http://skos.um.os/unescothos/C01985"/> 
<skos: related rdf:resource="http://skos.um.estunescothes/C00374"/> 
rolated rdt:tesource="http://skos.um.ey/unescothes/C00574" 
<skos: related rdf:resource="http://s um.os/unescothes/C00526”/> 
<skos::elated dí: resource="htp:/7 un. ex/unescothes/COt065”/> 
<skos: related rdf resource="http://skos.um.es/unescothes/CO1083S”/> 
<skos: related rdf:resource="http://skos.um.esunescothes/CD2003/> 
<skos:altLabel xni:lang="en">BRibliographic description</skos: altLabel> 
<skos:altLabelxmiilang="en">Catalogna</skos:altLabel> 
<skos:altLabel xmidang="en">Contralized catalogunmg</skos:altLabel> 
<skos:altLabel xmi:lang="en”>Cooperative catalogung</skos: altLabel> 
«<skos:altLabelxmilang="en">Descoptive cataloguing«/skos:altLabel> 
<skos:altLabel xmidang="en">Metadata</skos:altlabel> 
<skos:altLabel xwmilang="es” >Catalogación centralizada</skos:altLabel> 














<Lo 







<skos:altLabel xmidang="es">Catalogación descriptiva</skos:altlabol> 
<skos:altLabel xmi:lang="es”" >Descopción bibliográfica</skos;altLabel> 
<skos:altLabelxwmi-lang” "fr >Catalogage centralisé</skos:altLabel> 
<skos:altLabel xmi:lang="tr >Catalogage coopératil</skos:altLabel> 
<skos:altLabel xmilang="fr >Catalogage descriptif</skos:altLabel> 
<skos:altLabel xmiiang="fr>Descrippon bibliographique</skos:altlLabel> 
<skos:altLabel xmilang="fr">Metadata</skos:altLabel> 
<skos:altLabelxwmiilang="ru" >bubnnorpaquueckos onucamme-/skos:altLabel> 
<skos:altLabel xmidlang="0w">Uenrparmaionamoes 
xatanoruamposamne</skos:altl abel> 

<skos:allLabel xmnidang="14" >Obveguuennoo 
xatanoruimponamme</skos:altLabel> 

<skos:altLabel xenilang=""u” >Omucatenenos 
notanoruanpobanme=</skos;altLabel> 

<skos:altLabelxwmilang-"ru” >Meragammbie</skos:altLabel> 

</skos: Concept> 

</rdt:RDF> 


?http://skos.um.es/unescothes/C00525/rdfxml 
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Desarrollo automático de tesauros 
En cuanto al aporte informático para el desarrollo de tesauros, se distin- 
guen tres metodologías: 


* Tesauro manual: desde luego no se trata de un tesauro hecho u operado 
con la mano, como hace suponer el adjetivo. Es un tesauro cuyo dise- 
ño y desarrollo se basa principalmente en el trabajo intelectual de seres 
humanos, expertos en el dominio del tesauro y en los métodos para su 
elaboración. La tecnología informática es usada como una herramienta 
de apoyo que se aplica a los procesos involucrados, como la colecta de 
términos u otros. Desde el sector informático, especialmente de los de- 
sarrolladores Web, se considera que este tipo de tesauros resulta caro, 
consume tiempo, se desactualiza y es ineficiente para la búsqueda en la 
red (Zeng, 2012), aunque por supuesto esto es muy discutible. 


+ Tesauro automático: es un tesauro desarrollado por computadoras pro- 
gramadas especialmente. Se trata de una estructura de datos construida 
mediante la extracción de palabras claves y la determinación automática 
de las relaciones entre esas palabras claves. El investigador chino Wen 
Zeng considera que el desarrollo de un tesauro automático tiene cuatro 
etapas (Zeng, 2012): 


a. Extracción de términos. Incluye tanto la extracción propiamen- 
te dicha de los términos de los documentos, especialmente del área 
científica y técnica, como el análisis lingúístico de esos términos, en 
particular las estructuras sintácticas. 


b. Determinación automática de las relaciones semánticas. Para las 
relaciones asociativas se indica un análisis estadístico de coocurren- 
cias o una asociación basada en la estructura de los documentos. Para 
las relaciones jerárquicas se toma en cuenta primero la forma de los 
términos y luego se calcula por similaridad, de acuerdo al número de 
palabras similares y a la localización del término en el documento. 


c. Traducción automática de los términos. Tanto Zeng como otros 
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autores consideran indispensable que los tesauros operativos en la 
Web sean multilingúes para poder realizar una búsqueda exitosa en 
ella, dada la enorme cantidad de recursos disponibles en numerosos 
idiomas. 


d. Evaluación de los resultados. 


* Tesauro semiautomático: es una metodología que de una u otra manera 
combina las anteriores. Lauser et al. (2008) concluyen, a partir de una in- 
vestigación sobre tesauros de agricultura, que los términos provenientes 
de las ciencias duras como la química y la biología son más adecuados 
para su extracción por medios automáticos, no así los términos de otras 
áreas —como la economía o la administración— que requieren mayor 
trabajo intelectual de los expertos. 


Cabe resaltar la utilidad de los estudios bibliométricos como apoyo a 
cualquiera de las metodologías comentadas. Schneider (2004) señala que la 
contribución de estos métodos se basa en a) la capacidad del análisis de co- 
citación y del análisis del contexto de citas para identificar específicamente 
importantes términos candidatos para el tesauro porque surgen de los con- 
textos y acuerdos de la comunidad científica, y b) la capacidad del análisis 
de cocitación y de cotérminos para detectar las relaciones semánticas entre 
los términos. 
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Autoevaluación 

¿Qué opciones pueden elegirse para la creación de la base de datos del tesauro? 
¿Qué capacidades debe tener el programa informático de gestión de tesauros? 
¿Qué limitaciones debe tener el programa informático de gestión de tesauros? 
¿Qué debe validar el programa informático de gestión de tesauros? 


¿Qué vinculaciones debe facilitar el programa informático de gestión de 
tesauros? 


¿Con qué modelos debe ser compatible para funcionar en la Web? 
¿Qué es el modelo SKOS? 


Desde el punto de vista informático, ¿qué tipo de tesauros hay y en qué 
consisten? 
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